



































Java 是 目前 用 户 最 多 、 使 用 范围 最 广 的 软件 开发 技术 ，Java 的 技术 体系 主要 由 支撑 Java 程 序 运行 的 虚拟 机 、 为 各 开发 领域 提供 接口 支持 的 Java API、Java 编 程 语言 及 许 许多 多 的 第 三 方 Java 框 架 (如 
Spring 和 Struts 等 ) 构成 。 在 国内 ， 有 关 Java API、Java 语 言及 第 三 方 框架 的 技术 资料 和 书籍 非常 丰富 ， 相 比 之 下 ， 有 关 jJava 虚 拟 机 的 资料 却 显得 异常 贫乏 。 















































这 种 状况 很 大 程度 上 是 由 Java 开 发 技术 本 身 的 一 个 重要 优点 导致 的 : 在 虚拟 机 层面 隐藏 了 底层 技术 的 复杂 性 以 及 机 器 与 操作 系统 的 差异 性 。 运 行程 序 的 物理 机 器 情况 干 差 万 别 ， 而 Java 虚 拟 机 则 在 干 差 
万 别 的 物理 机 上 面 建立 了 统一 的 运行 平台 ， 实 现 了 在 任意 一 台 虚 拟 机 上 编译 的 程序 都 能 在 任何 一 台 虚 拟 机 上 正常 运行 。 这 一 极 大 的 优势 使 得 Java 应 用 的 开发 比 传统 C/C+ + 应 用 的 开发 更 高 效 和 快捷 ， 程 序 员 
可 以 把 主要 精力 集中 在 具体 业务 逻辑 上 ， 而 不 是 物理 硬件 的 兼容 性 上 。 一 般 情况 下 ， 一 个 程序 员 只 要 了 解 了 必要 的 Java API、Java 语 法 并 学 习 适 当 的 第 三 方 开发 框架 ， 就 已 经 基本 能 满足 日 常 开 发 的 需要 
了 ， 虚 拟 机 会 在 用 户 不 知 不 觉 中 完成 对 硬件 平台 的 兼容 以 及 对 内 存 等 资源 的 管理 工作 。 因 此 ， 了 解 虚拟 机 的 运作 并 不 是 一 般 开发 人 员 必须 掌握 的 知识 。 












































































































































然而 ， 凡 事 都 具备 两 面 性 。 随 着 Java 技 术 的 不 断 发 展 ， 它 被 应 用 于 越 来 越 多 的 领域 之 中 。 其 中 一 些 领 域 ， 如 电力 、 金 融 、 通 信 等 ， 对 程序 的 性 能 、 稳 定性 和 可 扩展 性 方面 都 有 极 高 的 要 求 。 一 个 程序 很 
可 能 在 10 个 人 同时 使 用 时 完全 正常 ， 但 是 在 10000 个 人 同时 使 用 时 就 会 变 慢 、 死 锁 甚 至 崩溃 。 毫 无 疑问 ， 要 满足 10000 个 人 同时 使 用 需要 更 高 性 能 的 物理 硬件 ， 但 是 在 绝 大 多 数 情 况 下 ， 提 升 硬件 效能 无 法 
等 比例 地 提升 程序 的 性 能 和 并 发 能 力 ， 有 时 甚至 可 能 对 程序 的 性 能 没有 任何 改善 作用 。 这 里 面 有 Java 虚 拟 机 的 原因 : 为 了 达到 为 所 有 硬件 提供 一 致 的 虚拟 平台 的 目的 ， 牺 牲 了 一 些 硬 件 相关 的 性 能 特性 。 更 
重要 的 是 人 为 原因 : 开发 人 员 如 果 不 了 解 虚拟 机 的 一 些 技术 特性 的 运行 原理 ， 就 无 法 写 出 最 适合 虚拟 机 运行 和 可 自 优化 的 代码 。 






























































































































































其 实 ， 目 前 商用 的 高 性 能 Java 虚 拟 机 都 提供 了 相当 多 的 优化 特性 和 调节 手段 ， 用 于 满足 应 用 程序 在 实际 生产 环境 中 对 性 能 和 稳定 性 的 要 求 。 如 果 只 是 为 了 入 门 学 习 ， 让 程序 在 自己 的 机 器 上 正常 运行 ， 
那么 这 些 特 性 可 以 说 是 可 有 可 无 的 ; 如 果 用 于 生产 环境 ， 尤 其 是 企业 级 应 用 开发 中 ， 就 迫切 需要 开发 人 员 中 至 少 有 一 部 分 人 对 虚拟 机 的 特性 及 调节 方法 具有 很 清晰 的 认识 ， 所 以 在 Java 开 发 体系 中 ， 对 架构 
师 、 系 统 调 优 师 、 高 级 程序 员 等 角色 的 需求 一 直 都 非常 大 。 学 习 虚 拟 机 中 各 种 自动 运作 的 特性 的 原理 也 成 为 了 java 程序 员 成 长 道路 上 必然 会 接触 到 的 一 课 。 通 过 本 书 ， 读 者 可 以 以 一 种 相对 轻松 的 方式 学 习 
虚拟 机 的 运作 原理 ， 对 Java 程 序 员 的 成 长 也 有 较 大 的 帮助 。 


































































































本 书 读者 对 象 








(1) 使 用 Java 技 术 体系 的 中 、 高 级 开发 人 员 











Java 虚 拟 机 作为 中 、 高 级 开发 人 员 必 须 修炼 的 知识 ， 有 着 较 高 的 学 习 门 覆 ， 本 书 可 作为 学 习 虚 拟 机 的 优秀 教材 。 
(2) 系统 调 优 师 


系统 调 优 师 是 近 几 年 才 兴起 的 职业 ， 本 书 中 的 大 量 案例 、 代 码 和 调 优 实战 将 会 对 系统 调 优 师 的 日 常 工作 有 直接 的 帮助 。 











(3) 系统 架构 师 























保障 系统 高 效 、 稳 定 和 可 伸缩 是 系统 架构 师 的 主要 职责 之 一 ， 而 这 与 虚拟 机 的 运作 密 不 可 分 ， 本 书 可 以 作为 他 们 设计 应 用 系统 底层 框架 的 参考 资料 。 








如 何 阅读 本 书 





本 书 一 共 分 为 五 个 部 分 : 走 近 Java、 自 动 内 存 管理 机 制 、 虚 拟 机 执行 子 系统 、 程 序 编译 与 代码 优化 、 高 效 并 发 。 各 个 部 分 基本 上 是 相互 独立 的 ， 没 有 必然 的 前 后 依赖 关系 ， 读 者 可 以 从 任何 一 个 感 兴 
的 专题 开始 阅读 ， 但 是 每 个 部 分 中 的 各 个 章节 间 有 先后 顺序 。 












































本 书 并 不 假设 读者 在 Java 领 域 具备 很 专业 的 技术 水 平 ， 因 此 在 保证 逻辑 准确 的 前 提 下 ， 尽 量 用 通俗 的 语言 和 案例 讲述 虚拟 机 中 与 开发 关系 最 为 密切 的 内 容 。 当 然 学 习 虚 拟 机 技术 本 身 就 需要 读者 有 一 定 
的 技术 基础 ， 且 本 书 的 读者 定位 是 中 、 高 级 程序 员 ， 因 此 本 书 假设 读者 自己 了 解 一 些 常用 的 开发 框架 、Java API 和 Java 语 法 等 基础 知识 。 





























本 书 在 语言 和 技术 上 有 如 下 的 约定 : 


“ 本 书 中 提 到 HotSpot 虚 拟 机 、JRockit 虚 拟 机 、WebLogic 服 务 器 等 产品 的 所 有 者 时 ， 仍 然 使 用 Sun 和 BEA 公 司 的 名 称 。 实 际 上 BEA 和 Sun 分 别 于 2008 年 和 2010 年 被 Oracle 公 司 收购 ， 现 在 已 经 不 存在 这 两 个 
商标 了 ， 但 是 毫 无 疑问 它们 都 是 对 Java 领 域 做 出 过 卓越 贡献 的 、 值 得 程序 员 纪念 的 公司 。 


“ JDK 从 1.5 版 本 开始 ， 在 官方 的 正式 文档 与 宣传 资料 中 已 经 不 再 使 用 类 似 “JDK 1.5” 的 名 称 ， 只 有 在 程序 员 内 部 使 用 的 开发 版 本 号 (Developer Version， 例 如 java-vetsion 的 输出 ) 中 才 继 续 沿用 1.5、1.6 
和 1.7 的 版 本 号 ， 而 公开 版 本 号 (Product Version) 则 改 为 JDK 5、JDK 6 和 J]DK 7 的 命名 方式 。 为 了 行文 一 致 ， 本 书 所 有 场合 统一 采用 开发 版 本 号 的 命名 方式 。 


“ 由 于 版 面 关系 ， 本 书 中 的 许多 示例 代码 都 没有 遵循 最 优 的 代码 编写 风格 ， 如 使 用 的 流 没有 关闭 流 等 ， 请 读者 在 阅读 时 注意 这 一 点 。 
“ 如 果 没 有 特殊 说 明 ， 本 书 中 所 有 的 讨论 都 是 以 Sun JDK 1.6 为 技术 平台 的 。 不 过 如 果 有 某 个 特性 在 各 个 版 本 间 的 变化 较 大 ， 一 般 都 会 说 明 它 在 各 个 版 本 间 的 差异 。 
内 容 特色 


第 一 部 分 。 走 近 Java 











本 书 的 第 一 部 分 为 后 文 的 讲解 建立 了 良好 的 基础 。 尽 管 了 解 Java 技 术 的 来 龙 去 脉 ， 以 及 编译 自己 的 OpenJDK 对 于 读者 理解 Java 虚拟 机 并 不 是 必需 的 ， 但 是 这 些 准备 过 程 可 以 为 走 近 Java 技 术 和 java 虚拟 
机 提供 很 好 的 引导 。 第 一 部 分 只 有 第 1 章 : 




















第 1 章 介绍 了 Java 技 术 体系 的 过 去 、 现 在 和 未 来 的 发 展 趋势 ， 并 介绍 了 如 何 独立 编译 一 个 OpenJDK 7。 


第 二 部 分 “自动 内 存 管理 机 制 









































因为 程序 员 把 内 存 控制 的 权力 交 给 了 Java 虚 拟 机 ， 所 以 可 以 在 编码 的 时 候 享受 自动 内 存 管理 的 诸多 优势 ， 不 过 也 正 因为 这 个 原因 ， 一 旦 出 现 内 存 泄漏 和 溢出 方面 的 问题 ， 如 果 不 了 解 虚拟 机 是 怎样 使 
内 存 的 ， 那 么 排查 错误 将 会 成 为 一 项 异常 艰难 的 工作 。 第 二 部 分 包括 第 2~5 章 : 


























第 2 章 讲解 了 虚拟 机 中 的 内 存 是 如 何 划 分 的 ， 哪 部 分 区 域 、 什 么 样 的 代码 和 操作 可 能 导致 内 存 溢 出 异常 ， 并 讲解 了 各 个 区 域 出 现 内 存 溢出 异常 的 常见 原因 。 














第 3 章 分 析 了 垃圾 收集 的 算法 和 JDK 1.6 中 提供 的 几 款 垃 圾 收集 器 的 特点 及 运作 原理 ， 通 过 代码 实例 验证 了 Java 虚 拟 机 中 的 自动 内 存 分 配 及 回收 的 主要 规则 。 















































第 4 章 ”介绍 了 随 JDK 发 布 的 6 个 命令 行 工具 与 2 个 可 视 化 的 故障 处 理工 具 的 使 用 方法 。 














第 5 章 “与 读者 分 享 了 几 个 比较 有 代表 性 的 实际 案例 ， 还 准备 了 一 个 所 有 开发 人 员 都 能 “亲身 实战 ”的 练习 ， 读 者 可 通过 实践 来 获得 故障 处 理 和 调 优 的 经 验 。 
第 三 部 分 “虚拟 机 执行 子 系统 


执行 子 系统 是 虚拟 机 中 必 不 可 少 的 组 成 部 分 ， 了 解 了 虚拟 机 如 何 执行 程序 ， 才 能 写 出 更 优秀 的 代码 。 第 三 部 分 包括 第 6~9 章 : 








第 6 章 讲解 了 Class 文 件 结构 中 的 各 个 组 成 部 分 ， 以 及 每 个 部 分 的 定义 、 数 据 结构 和 使 用 方法 ， 以 实战 的 方式 演示 了 Class 的 数据 是 如 何 存储 和 访问 的 。 




















第 7 章 “介绍 了 在 类 加 载 过 程 的 “加 载 ”、“ 验 证 ”、“ 准 备 ”、“ 解 析 ” 和 “初始 化 ”这 五 个 阶段 中 虚拟 机 分 别 执行 了 哪些 动作 ， 还 介绍 了 类 加 载 器 的 工作 原理 及 其 对 虚拟 机 的 意义 。 


第 8 章 分 析 了 虚拟 机 在 执行 代码 时 如 何 找到 正确 的 方法 ， 如 何 执行 方法 内 的 字 节 码 ， 以 及 执行 代码 时 涉及 的 内 存 结构 。 




















第 9 章 通过 四 个 类 加 载 及 执行 子 系统 的 案例 ， 分 享 了 使 用 类 加 载 器 和 处 理 字 节 码 的 一 些 值得 欣赏 和 借鉴 的 思路 ， 并 通过 一 个 实战 练习 来 加 深 对 前 面 理论 知识 的 理解 。 


























第 四 部 分 “程序 编译 与 代码 优化 























Java 程 序 从 源码 编译 成 字 节 码 和 从 字 节 码 编译 成 本 地 机 器 码 的 这 两 个 过 程 ， 合 并 起 来 其 实 就 等 同 于 一 个 传统 编译 器 所 执行 的 编译 过 程 。 第 四 部 分 包括 第 10 和 11 




















第 10 章 分 析 了 Java 语 言 中 的 泛 型 、 自 动 装 箱 拆 箱 、 条 件 编译 等 多 种 语法 糖 的 前 因 后 果 ， 并 通过 实战 案例 演示 了 如 何 使 用 插入 式 注解 处 理 器 来 实现 一 个 检查 程序 命名 规范 的 编译 器 插件 。 


























第 11 章 讲解 了 虚拟 机 的 热点 探测 方法 、HotSpot 的 即时 编译 器 、 编 译 触发 条 件 ， 以 及 如 何 从 虚拟 机 外 部 观察 和 分 析 J 咱 编译 的 数据 和 结果 。 此 外 ， 还 讲解 了 几 种 常见 的 编译 期 优化 技术 。 


第 五 部 分 “高效 并 发 














Java 语 言 和 虚拟 机 提供 了 原生 的 、 完 善 的 多 线程 支持 ， 使 得 它 天 生 就 适合 开发 多 线程 并 发 的 应 用 程序 。 不 过 我 们 不 能 期 望 系统 来 完成 所 有 与 并 发 相关 的 处 理 ， 了 解 并 发 的 内 幕 也 是 一 个 高 级 程序 员 不 可 
缺少 的 课程 。 第 五 部 分 包括 第 12 和 13 章 : 














第 12 章 讲解 了 虚拟 机 的 Java 内 存 模型 的 结构 和 操作 ， 以 及 原子 性 、 可 见 性 和 有 序 性 在 Java 内 存 模型 中 的 体现 ， 介 绍 了 先行 发 生 原 则 及 使 用 ， 还 讲解 了 线程 在 Java 语 言 中 是 如 何 实现 的 。 























第 13 章 介绍 了 线程 安全 所 涉及 的 概念 和 分 类 、 同 步 实现 的 方式 以 及 虚拟 机 的 底层 运作 原理 ， 并 且 还 介绍 了 虚拟 机 实现 高 效 并 发 所 采取 的 一 系列 锁 优 化 措施 。 

















本 书 名 为 “深入 理解 Java 虚 拟 机 ”， 但 要 想 真 的 深入 理解 虚拟 机 ， 仅 赁 一 本 书 肯定 是 远 远 不 够 的 ， 读 者 可 以 通过 下 面 的 信息 找到 更 多 关于 java 虚拟 机 方面 的 资料 。 我 在 写作 此 书 的 时 候 ， 也 从 下 面 这 些 
参考 资料 中 获得 了 很 大 的 帮助 。 








(1) 书籍 


《The Java Virtual Machine Specification，Second Edition》 (1 














《Java 庶 拟 机 规范 (第 2 版 ) 》，1999 年 4 月 出 版 。 国 内 并 没有 引进 这 本 书 ， 自 然 也 就 没有 中 文 译本 ， 但 全 书 的 电子 版 是 免费 发 布 的 ， 在 IT 书籍 中 它 已 经 非常 “高 寿 ” 了 四 (这 本 书 的 第 3 版 已 处 于 基本 
完成 的 草稿 状态 ， 在 JDK 1.7 正 式 版 发 布 后 这 本 书 应 该 就 会 推出 第 3 版 ) 。 要 学 习 虚 拟 机 ， 虚 拟 机 规范 无 论 如 何 都 是 必须 读 的 。 这 本 书 的 概念 和 细节 描述 与 Sun 的 早期 虚拟 机 (Sun Classic VM) 高 度 吻合 ， 
不 过 ， 随 着 技术 的 发 展 ， 高 性 能 虚拟 机 真正 的 细节 实现 方式 与 虚拟 机 规范 所 描述 的 差距 已 经 越 来 越 大 。 但 是 ， 如 果 只 能 选择 一 本 参考 书 来 了 解 虚 拟 机 的 话 ， 那 仍然 是 这 本 书 。 





















































* 《The Java Language Specification, Third Edition》 加 














《Java 语 言 规范 (第 3 版 ) 》，2005 年 7 月 由 机 械 工业 出 版 社 出 版 ， 不 过 出 版 的 是 影印 版 ， 没 有 中 文 译本 。 虽 然 Java 虚 拟 机 并 不 是 Java 语 言 专 有 的 ， 但 是 了 解 Java 语 言 的 各 种 细节 规定 对 虚拟 机 的 行为 也 
是 很 有 帮助 的 ， 它 与 《Java 虚 拟 机 规范 (第 2 版 ) 》 都 是 Sun 官 方 出 品 的 书籍 ， 而 且 这 本 书 还 是 由 Java 之 父 james Gosling 亲 自 撰写 的 。 











* 《Oracle JRockit The Definitive Guide》 











《Oracle JRockit 权 威 指南 》，2010 年 7 月 出 版 ， 国 内 也 没有 (可 能 是 尚未 ) 引进 这 本 书 ， 它 是 由 JRockit 的 两 位 资深 开发 人 员 (其 中 一 位 是 JRockit Mission Control 团 队 的 TeamLeader) 撰写 的 高 
JRockit 虚 拟 机 使 用 指南 。 昌 然 JRockit 的 用 户 量 可 能 不 如 HotSpot 多 ， 但 也 是 最 流行 的 三 大 商业 虚拟 机 之 一 ， 并 且 不 同 虚 拟 机 中 的 很 多 实现 思路 都 是 可 以 对 比 参 照 的 。 这 本 书 是 了 解 现代 高 性 能 虚拟 机 的 很 好 
的 途径 。 






























































* KInside the Java 2Virtual Machine, Second Edition》 





《深入 Java 虚 拟 机 (第 2 版 ) 》，2000 年 1 月 出 版 ，2003 年 机 械 工 业 出 版 社 出 版 了 中 文 译本 。 在 相当 长 的 时 间 里 ， 这 本 书 是 唯一 一 本 关于 Java 虚 拟 机 的 中 文 


网 
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(2) 网 站 资源 


' 高 级 语言 虚拟 机 圈子 : http://hllvm.group.iteye.com/ 
































里 面 有 一 些 国内 关于 虚拟 机 的 讨论 ， 并 不 只 限于 JVM ， 而 是 涉及 对 所 有 的 高 级 语言 虚拟 机 (High-Level Language Virtual Machine) 的 讨论 ， 但 该 网 站 建立 在 ITEye 内 上 ， 自 然 还 是 以 讨论 Java 虚 拟 机 
为 主 。 撒 迦 ( 莫 枢 ) 的 博客 (http://rednaxelafx.iteye.com/) 是 另外 一 个 非常 有 价值 的 虚拟 机 及 编译 原理 等 资料 的 分 享 园地 。 



































* HotSpot Internals: http://wikis.sun.com/display/HotSpotInternals/Home 














一 个 关于 OpenJDK 的 Wiki 网 站 ， 许 多 文章 都 由 JDK 的 开发 团队 编写 ， 更 新 很 慢 ， 但 是 仍然 有 很 大 的 参考 价值 。 

















* The HotSpot Group: http://openjdk.java.net/groups/hotspot/ 











HotSpot 组 群 ， 包 含 虚 拟 机 开发 、 编 译 器 、 垃 圾 收集 和 运行 时 四 个 邮件 组 ， 其 中 有 关于 HotSpot 虚 拟 机 的 最 新 讨论 。 
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在 本 书 完稿 时 ， 我 并 没有 像 想象 中 那样 兴奋 或 放松 ， 写 作 时 的 那 种 “ 战 战 诡 应 、 如 履 薄 冰 ” 的 感觉 依然 葵 绕 在 心头 。 在 每 一 章 、 每 一 节 落 笔 之 时 ， 我 都 在 考虑 如 何 才 能 把 各 个 知识 点 更 有 条 理 地 讲述 出 
来 ， 都 在 担心 会 不 会 由 于 自己 理解 有 偏差 而 误导 了 大 家 。 轿 于 我 的 写作 水 平和 写作 时 间 ， 书 中 难免 存在 不 妥 之 处 ， 所 以 特地 开通 了 一 个 读者 邮箱 (understandingjvm@gmail.com) 与 大 家 交流 ， 大 家 如 有 
任何 意见 或 建议 都 欢迎 与 我 联系 。 此 外 ， 大 家 也 可 以 通过 我 的 微 博 (http://t.sina.com.cn//icyfenix) 与 我 取得 联系 。 

















勘误 











写 书 和 写 代码 一 样 ， 刚 开始 都 是 不 完美 的 ， 需 要 不 断 地 修正 和 重 构 ， 本 书 也 不 例外 。 如 果 大 家 在 阅读 本 书 的 过 程 中 发 现 了 本 书 中 存在 的 任何 问题 ， 都 欢迎 反馈 给 我 们 。 我 们 会 把 本 书 的 勘误 集中 公布 在 





icyfenx.iteye.com/blog/1119214, 


[中 官方 地 址 : http://java.sun.com/docs/books/jvms/second_edition/html/VMSpecTOC.doc.html。 
[中 在 这 十 多 年 间 虚 拟 机 规范 的 更 新 可 以 通过 JSR-924 规范 来 跟踪 ，JSR-924 规范 的 地 址 为 : http://jcp.org/aboutJava/communityprocess/maintenance/jsr924/index3.html。 
[3] 官方 地 址 : http://java.sun.com/docs/books/jls/download/langspec-3.0.pdf。 

团 该 网 站 原名 为 JavaEye， 近 期 更 名 为 ITEye。 
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本 章 主要 内 容 


"Java 技术 体系 
“ Java 发 展 史 
“ 展望 Java 技 术 的 未 来 


“ 实战 : 自己 编译 JDK 

















世界 上 并 没有 完美 的 程序 ， 但 我 们 并 不 因此 而 泪 形 ， 因 为 写 程序 本 来 就 是 一 个 不 断 追 求 完美 的 过 程 。 


1.1 概述 
































Java 不 仅仅 是 一 门 编程 语言 ， 它 还 是 一 个 由 一 系列 计算 机 软件 和 规范 形成 的 技术 体系 ， 这 个 技术 体系 提供 了 完整 的 用 于 软件 开发 和 跨 平台 部 署 的 支持 环境 ， 并 广泛 应 用 于 嵌入 式 系统 、 移 动 终端 、 企 业 


人 


服务 器 和 大 型 机 等 各 种 场合 ， 如 图 1-1 所 示 。 时 至 今日 ，Java 技 术 体系 已 经 吸引 了 600 多 万 软件 开发 者 ， 这 是 全 球 最 大 的 软件 开发 团队 。 使 用 Java 的 设备 多 达 几 十 亿 台 ， 其 中 包括 8 亿 多 台 个 人 计算 机 、21 亿 



























































部 移动 电话 及 其 他 手持 设备 、35 亿 个 智能 卡 ， 以 及 大 量 机 顶 盒 、 导 航 系统 和 其 他 设备 [1]。 











Java 能 获得 如 此 广泛 的 认可 ， 除 了 因为 它 拥有 一 门 结构 严谨 、 面 向 对 象 的 编程 语言 之 外 ， 还 有 许多 不 可 忽视 的 优点 : 它 摆脱 了 硬件 平台 的 束缚 ， 实 现 了 “一 次 编写 ， 到 处 运行 ”的 理想 ; 它 提供 了 一 科 
相对 安全 的 内 存 管理 和 访问 机 制 ， 避 免 了 绝 大 部 分 的 内 存 泄漏 和 指针 越界 问题 ， 它 实现 了 热点 代码 检测 和 运行 时 编译 及 优化 ， 这 使 得 Java 应 用 能 随 着 运行 时 间 的 增加 而 获得 更 高 的 性 能 ， 它 有 一 套 完善 的 应 
程序 接口 ， 还 有 无 数 的 来 自 商业 机 构 和 开源 社区 的 第 三 方 类 库 来 帮助 实现 各 种 各 样 的 功能 .…Java 所 带 来 的 这 些 好 处 让 程序 的 开发 效率 得 到 了 很 大 的 提升 。 作 为 一 名 Java 程 序 员 ， 在 编写 程序 时 除了 尽情 发 
挥 Java 的 各 种 优势 外 ， 还 应 该 去 了 解 和 思考 一 下 Java 技 术 体系 中 这 些 技术 是 如 何 实现 的 。 认 清 这 些 技术 的 运作 本 质 ， 是 自己 思考 “程序 这 样 写 好 不 好 ”的 基础 和 前 提 。 当 我 们 在 使 用 一 门 技术 时 ， 如 果 不 再 
依赖 书本 和 他 人 就 能 得 到 这 个 问题 的 答案 ， 那 才 算 升 华 到 了 “不惑 ” 的 境界 。 

























































































图 1-1 Java 技术 的 广泛 应 用 
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本 书 将 会 与 读者 一 起 分 析 Java 技 术 中 最 重要 的 那些 特性 的 实现 原理 。 在 本 章 中 ， 我 们 将 重点 介绍 Java 技 术 体系 所 包括 的 内 容 ， 以 及 Java 的 历史 、 现 在 和 未 来 的 发 展 趋势 。 








[由 这 些 数据 是 Java 的 广告 词 ， 它 们 来 源 于 : http://www.java.com/zh_CN/about/。 


1.2 _ Java 技术 体系 








从 广义 上 讲 ，Clojure、JRuby、Groovy 等 运行 于 Java 虚 拟 机 上 的 语言 及 其 相关 的 程序 都 属于 Java 技 术 体系 的 一 员 。 如 果 仅 从 传统 意义 上 来 看 ，Sun 官 方 所 定义 的 Java 技 术 体系 包括 了 以 下 几 个 组 成 部 





Ys 
"Java 程序 设计 语言 
“ 各 种 硬件 平台 上 的 Java 虚 拟 机 
“Class 文 件 格式 
. Java API 类 库 


“来自 商业 机 构 和 开源 社区 的 第 三 方 Java 类 库 











我 们 可 以 把 Java 程 序 设计 语言 、Java 虚 拟 机 、Java APl 类 库 这 三 部 分 统称 为 JDK (Java Development Kit) ，JDK 是 


会 以 JDK 来 代 车 整 个 Java 技 术 体系 。 另外， 可 以 把 Java APl 类 库 中 的 Java SE API 子 集 [0J 和 Java 虚 拟 机 这 两 部 分 统称 为 JRE (Java Runtime Environment) ，JRE 是 支持 Java 程 序 运行 的 标准 环境 。 














了 Java 技 术 体系 所 包括 的 内 容 ， 以 及 JDK 和 JRE 所 涵盖 的 范围 。 








于 支持 Java 程 序 开发 的 最 小 环境 ， 在 后 面 的 内 容 中 ， 为 了 讲解 方便 ， 有 一 些 地 方 
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图 1-2 ”Java 技术 体系 所 包括 的 内 容器 
以 上 是 根据 各 个 组 成 部 分 的 功能 来 进行 划分 的 ， 如 果 按 照 技 术 所 服务 的 领域 来 划分 ， 或 者 说 按照 Java 技 术 关注 的 重点 业务 领域 来 划分 ，Java 技 术 体 系 可 以 分 为 四 个 平台 ， 分 别 为 : 
:Java Card: 支持 一 些 Java 小 程序 (Applets) 运行 在 小 内 存 设备 (如 智能 卡 ) 上 的 平台 。 
“Java ME (Micro Edition) : 支持 Java 程 序 运行 在 移动 终端 (手机 、PDA) 上 的 平台 ， 对 JavaAPI 有 所 精简 ， 并 加 入 了 针对 移动 终端 的 支持 ， 这 个 版 本 以 前 称 为 J2ME。 


“Java SE (Standard Edition) : 支持 面向 桌面 级 应 用 (如 Windows 下 的 应 用 程序 ) 的 Java 平 台 ， 提 供 了 完整 的 Java 核 心 API， 这 个 版 本 以 前 称 为 J2SE。 


Java EE (Enterprise Edition) : 支持 使 用 多 层 架 构 的 企业 应 用 (如 ERP、CRM 应 用 ) 的 Java 平 台 ， 除 了 提供 Java SE API 外 ， 还 对 其 做 了 大 量 的 扩充 加 并 提供 了 相关 的 部 署 支持 ， 这 个 版 本 以 前 称 为 
J2EE。 


[中 JDK 1.6 的 Java SE API 范围 : http://download.oracle.com/javase/6/docs/api/。 
[中 图片 来 源 : http://download.oracle.com/javase/6/docs/。 


D] 这 些 扩展 一 般 以 javax.* 作 为 包 名 ， 而 以 java* 为 包 名 的 包 都 是 Java SE API 的 核心 包 ， 但 由 于 历史 原因 ， 一 部 分 曾经 是 扩展 包 的 API 后 来 进入 了 核心 包 ， 因 此 核心 包 中 也 包含 了 不 少 javax.* 的 包 名 。 


1.3 Java 发 展 史 


从 第 一 个 Java 版 本 诞生 到 现在 已 经 有 16 年 的 时 间 了 。 沧海 桑田 一 瞬间 ， 转 眼 16 年 过 去 了 ， 在 图 1-3 所 展示 的 时 间 线 中 ， 我 们 看 到 JDK 已 经 发 展 到 了 1.7 版 。 在 这 16 年 里 还 诞生 了 无 数 和 Java 相 关 的 产品 、 
技术 和 标准 。 现 在 让 我 们 进入 时 间 隧 道 ， 从 孕育 Java 语 言 的 时 代 开 始 ， 再 来 回顾 一 下 Java 的 发 展 轨迹 和 历史 变迁 。 


1995 1997 1999 2001 2003 2005 2007 2009 





J2SE 1.2 J2SE 1.4 Java SE6 
“Playground” “Merlin” 


J2SE 1.3 J2SE 5.0 Java SE7 
JDK 1.1 “Kestrel” “Tiger” 


图 1-3 Java 技 术 发 展 的 时 间 线 


1991 年 4 月 ， 由 James Gosling 博 士 领导 的 绿色 计划 (Green Project) 开始 启动 ， 此 计划 的 目的 是 开发 一 种 能 够 在 各 种 消费 性 电子 产品 (如 机 顶 盒 、 冰 箱 、 收 音 机 等 ) 上 运行 的 程序 架构 。 这 个 计划 的 
产品 就 是 Java 语 言 的 前 身 : Oak (橡树 ) 。Oak 当 时 在 消费 品 市 场 上 并 不 算 成 功 ， 但 随 着 1995 年 互联 网 潮流 的 兴起 ，Oak 迅 速 找 到 了 最 适合 自己 发 展 的 市 场 定位 并 晓 变 成 为 Java 语 言 。 








1995 年 5 月 23 日 ，Oak 语 言 改名 为 Java， 并 且 在 SunWorld 大 会 上 正式 发 布 了 Java1.0 版 本 。Java 语 言 第 一 次 提出 了 “Write Once，Run Anywhere” 的 口号 。 


1996 年 1 月 23 日 ，JDK 1.0 发 布 ，Java 语 言 有 了 第 一 个 正式 版 本 的 运行 环境 。JDK 1.0 提 供 了 一 个 纯 解释 执行 的 Java 虚 拟 机 实现 (Sun Classic VM) 。JDK 1.0 版 本 的 代表 技术 包括 : Java 虚 拟 机 、Applet 
和 AWT 等 。 











1996 年 4 月 ，10 个 最 主要 的 操作 系统 供应 商 声明 将 在 其 产品 中 嵌入 java 技术 。 同 年 9 月 ， 已 有 大 约 8.3 万 个 网 页 应 用 Java 技术 来 制作 。 在 1996 年 5 月 底 ，Sun 于 美 | 
JavaOne 成 为 全 世界 数 百 万 Java 语 言 开发 者 每 年 一 度 的 技术 盛会 。 
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旧金山 举行 了 首届 JavaOne 大 会 ， 从 此 
































1997 年 2 月 19 日 ，Sun 发 布 了 JDK 1.1，Java 技 术 的 一 些 最 基础 的 支撑 点 (如 JDBC 等 ) 都 是 在 JDK 1.1 版 本 中 发 布 的 ，JDK 1.1 的 技术 代表 有 : JAR 文 件 格式 、JDBC、JavaBeans、RMI1。jJava 语 法 也 有 了 
一 定 的 发 展 ， 如 内 部 类 (Inner Class) 和 反射 (Reflection) 都 是 在 这 个 时 候 出 现 的 。 



































直到 1999 年 4 月 8 日 ，JDK 1.1 一 共 发 布 了 1.1.0 至 1.1.8 九 个 版 本 。 从 1.1.4 之 后 ， 每 个 JDK 版 本 都 有 一 个 自己 的 名 字 (工程 代号 ) ， 分 别 为 : JDK 1.1.4-Sparkler (宝石 ) 、JDK 1.1.5-Pumpkin (南瓜 ) 、 
JDK 1.1.6-Abigail ( 阿 比 盖 尔 ， 女 子 名 ) 、JDK 1.1.7-Brutus ( 布 鲁 图 ， 古 罗马 政治 家 和 将 军 ) 和 JDK 1.1.8-Chelsea (切尔西 ， 城 市 名 ) 。 
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1998 年 12 月 4 日 ，JDK 迎 来 了 一 个 里 程 碑 式 的 版 本 JDK 1.2， 工 程 代 号 为 Playground (竞技 场 ) ，Sun 在 这 个 版 本 中 把 Java 技 术 体系 拆 分 为 3 个 方向 ， 分 别 是 面向 桌面 应 用 开发 的 J2SE (Java 
2Platform，Standard Edition) 、 面 向 企业 级 开发 的 J2EE (Java 2Platform，Enterprise Edition) 和 面向 手机 等 移动 终端 开发 的 J2ME (Java 2Platform，Micro Edition) 。 在 这 个 版 本 中 出 现 的 代表 性 
技术 非常 多 ， 如 EJB、Java Plug-in、Java IDL、Swing 等 ， 并 且 在 这 个 版 本 中 Java 虚 拟 机 第 一 次 内 置 了 JIT (Just In Time) 编译 器 (JDK 1.2 中 曾 并 存 过 3 个 虚拟 机 ， 分 别 是 Classic VM、Hot Spot VM 和 
Exact VM， 其 中 Exact VM 只 在 Solaris 平 台 出 现 过 ; 后 面 2 个 虚拟 机 都 是 内 置 JIT 编 译 器 的 ， 而 之 前 的 版 本 所 带 的 Classic VM 只 能 以 外 挂 形式 使 用 J 川 编 译 器 ) 。 在 语言 和 API 级 别 上 ，Java 添 加 了 strictfp 关 键 
字 与 现在 Java 编 码 之 中 极为 常用 的 一 系列 Collections 集 合 类 。 在 1999 年 3 月 和 7 月 ， 分 别 有 JDK 1.2.1 和 JDK 1.2.2 两 个 小 版 本 发 布 。 



































































































































1999 年 4 月 27 日 ，HotSpot 虚 拟 机 发 布 ，HotSpot 最 初 由 一 家 名 为 “Longview Technologies” 的 小 公司 开发 ， 因 为 HotSpot 的 优异 表现 ， 这 家 公司 在 1997 年 被 Sun 公 司 收购 了 。HotSpot 虚 拟 机 发 布 
时 是 作为 JDK 1.2 的 附加 程序 提供 的 ， 后 来 它 成 为 了 JDK 1.3 及 之 后 所 有 版 本 的 Sun JDK 的 默认 虚拟 机 。 





















































2000 年 5 月 8 日 ， 工 程 代号 为 Kestrel (美洲 红 集 ) 的 JDK 1.3 发 布 ，JDK 1.3 相 对 于 JDK 1.2 的 改进 主要 表现 在 一 些 类 库 (如 数学 运算 和 新 的 Timer API 等 ) 上 ，JNDI 服 务 从 JDK 1.3 开 始 被 作为 一 项 平台 级 
服务 提供 (以 前 JNDI 仅 仅 是 一 项 扩展 ) ， 使 用 CORBA IIOP 来 实现 RMI 的 通讯 协议 ， 等 等 。 这 个 版 本 还 对 Java 2D 做 了 很 多 改进 ， 提 供 了 大 量 新 的 Java 2D API， 并 且 新 添加 了 JavaSound 类 库 。JDK 1.3 有 1 
个 修正 版 本 JDK 1.3.1， 工 程 代号 为 Ladybird ( 标 虫 ) 于 2001 年 5 月 17 日 发 布 。 













































































自从 JDK 1.3 开 始 ，Sun 维 持 了 一 个 习惯 : 大 约 每 





EE 





两 年 发 布 一 个 JDK 的 主 版 本 ， 以 动物 名 称 命名 ， 期 间 发 布 的 各 个 修正 版 本 则 以 昆虫 名 称 作为 工程 名 称 。 





























2002 年 2 月 13 日 ，JDK 1.4 发 布 ， 工 程 代 号 为 Merlin ( 灰 背 集 ) 。JDK 1.4 是 Java 真 正 走向 成 熟 的 一 个 版 本 ，Compaq、Fujitsu、SAS、Symbian、IBM 等 著名 公司 都 有 参与 甚至 实现 自己 独立 的 JDK 
1.4。 哪 怕 是 在 近 10 年 后 的 今天 ， 仍 然 有 许多 主流 应 用 (Spring、Hibernate、Struts 等 ) 能 直接 运行 在 JDK 1.4 之 上 , 或 者 继续 发 布 能 运行 在 1.4 上 的 版 本 。JDK 1.4 同 样 发 布 了 很 多 新 的 技术 特性 ， 如 正则 表 
达 式 、 异 常 链 、NIO、 日 志 类 、XML 解 析 器 和 XSLT 转 换 器 ， 等 等 。JDK 1.4 有 两 个 后 续 修 正版 : 2002 年 9 月 16 日 发 布 的 工程 代号 为 Grasshopper ( 昨 蜂 ) 的 JDK 1.4.1 与 2003 年 6 月 26 日 发 布 的 工程 代号 为 
Mantis ( 星 晴 ) 的 JDK 1.4.2。 



















































































2002 年 前 后 还 发 生 了 一 件 与 Java 没有 直接 关系 ， 但 事实 上 对 Java 的 发 展 进程 影响 很 大 的 事件 ， 即 微软 的 .NET Framework 发 布 。 这 个 无 论 是 技术 实现 还 是 目标 用 户 上 都 与 Java 有 很 多 相近 之 处 的 技术 平 
台 给 Java 带 来 了 很 多 讨论 、 比 较 和 竞争 ，.NET 平 台 和 Java 平 台 之 间 声 势 浩 大 的 熟 优 熟 劣 的 论战 到 今天 为 止 仍然 在 继续 。 








































































































2004 年 9 月 30 日 ，JDK 1.5 发 布 [1]， 工 程 代号 为 Tiger (老虎 ) 。 从 JDK 1.2 以 来 ，Java 在 语法 层面 上 的 变化 一 直 很 小 ， 而 JDK 1.5 在 Java 语 法 易 用 性 上 做 出 了 非常 大 的 改进 。 自 动 装 箱 、 泛 型 、 动 态 注解 、 
枚 举 、 可 变 长 参数 、 人 遍历 循环 (foreach 循 环 ) 等 语法 特性 都 是 在 JDK 1.5 中 加 入 的 。 在 虚拟 机 和 API 层 面 上 ， 这 个 版 本 改进 了 Java 的 内 存 模型 (java Memory Model，JMM) 、 提 供 了 
java.util.concurrent 并 发 包 等 。 另 外 ，JDK 1.5 是 官方 声明 可 以 支持 Windows 9x 平 台 的 最 后 一 个 JDK 版 本 。 
































2006 年 12 月 11 日 ，JDK 1.6 发 布 ， 工 程 代号 为 Mustang (野马 ) 。 这 是 目前 为 止 最 新 的 正式 版 JDK (截至 本 书 完稿 时 ，JDK 1.7 仍 然 处 于 Early Access 版 本 ) 。 在 这 个 版 本 中 ，Sun 终 结 了 从 JDK 1.2 开 始 


已 经 有 8 年 历史 的 J2EE、J2SE、J2ME 的 命名 方式 ， 启 用 了 Java SE 6、Java EE 6、Java ME 6 的 命名 来 代 蔡 。JDK 1.6 的 改进 包括 : 提供 动态 语言 支持 (通过 内 置 Mozilla JavaScript Rhino 引 擎 实现 ) 、 提 供 
编译 API 和 微型 HTTP 服 务 器 AP1， 等 等 。 同 时 ， 这 个 版 本 对 Java 虚 拟 机 的 内 部 做 了 大 量 改进 ， 包 括 锁 与 同步 、 垃 圾 收集 、 类 加 载 等 方面 的 算法 都 有 相当 多 的 改动 。 







































































在 2006 年 11 月 13 日 的 JavaOne 大 会 上 ，Sun 宣 布 最 终 会 把 Java 开 源 ， 并 在 随后 的 一 年 多 时 间 内 ， 陆 续 地 在 GPL v2 (GNU General Public License v2) 协议 下 公开 了 JDK 各 个 部 分 的 源码 ， 并 建立 了 
OpenJDK 组 织 对 这 些 源码 进行 独立 管理 。 除 了 极 少量 的 产权 代码 (Encumbered Code， 这 部 分 代码 大 多 是 Sun 本 身 也 无 权限 进行 开源 处 理 的 ) 外 ，OpenJDK 几 乎 包括 了 Sun JDK 的 全 部 代码 。OpenJDK 的 
质量 主管 曾经 表示 ， 在 JDK 1.7 中 ，Sun JDK 和 OpenJDK 除 了 代码 文件 头 的 版 权 注释 之 外 ， 代 码 基本 上 完全 一 样 ， 所 以 OpenJDK 7 与 Sun JDK 1.7 本 质 上 就 是 同一 套 代 码 库 出 来 的 产品 。 







































































JDK 1.6 发 布 以 后 ， 由 于 代码 复杂 性 的 增加 、JDK 开 源 、 开 发 JavaFX、 经 济 危机 及 Sun 收 购 案 等 原因 ，Sun 在 JDK 发 展 以 外 的 事情 上 耗费 了 很 多 资源 ，JDK 的 更 新 没有 再 维持 两 年 发 布 一 个 主 版 本 的 发 展 速 
度 。JDK 1.6 到 今天 为 止 一 共 发 布 了 25 个 Update， 最 新 的 版 本 为 Java SE 6Update 25， 于 2011 年 4 月 21 日 发 布 。 



























































2009 年 2 月 19 日 ， 工 程 代号 为 Dolphin (海豚 ) 的 JDK 1.7 完 成 了 其 第 一 个 里 程 碑 版 本 。 根 据 JDK 1.7 的 功能 规划 ， 一 共 设 置 了 10 个 里 程 碑 。 最 后 一 个 里 程 碑 版 本 于 2010 年 9 月 9 日 结束 。 从 发 布 的 Early 
Access 版 看 来 目前 JDK 1.7 的 主体 功能 ， 已 经 比较 完善 ， 只 剩 下 Lambda 项 目 (Lambda 表 达 式 ) 、Jigsaw (模块 化 支持 ) 和 Coin (语言 细节 进化 ) 子 项 目的 部 分 工作 尚未 完成 ，Oracle 宣 布 JDK 1.7 正 式 版 










































































将 于 2011 年 7 月 28 日 推出 ， 可 能 会 把 不 能 按时 完成 的 ambda、Jigsaw 和 部 分 Coin 放 入 JDK 1.8 之 中 。JDK 1.7 的 主要 改进 包括 : 提供 新 的 G1 收 集 器 、 加 强 对 非 Java 语 言 的 调用 、 语 言 级 的 模块 化 支持 ( 取 
决 于 Jigsaw 项 目 能 不 能 完成 ) 、 升 级 类 加 载 架构 ， 等 等 。 
































2009 年 4 月 20 日 ，Oracle 宣 布 正 式 以 74 亿 美元 的 价格 收购 Sun 公 司 ，Java 商 标 从 此 正式 归 Oracle 所 有 (Java 语 言 本 身 并 不 属于 哪 家 公司 所 有 ， 它 由 JCP 组 织 进行 管理 ， 尽 管 JCP 主 要 是 由 Sun 或 者 说 
Oracle 所 领导 的 ) 。 由 于 此 前 Oracle 已 经 收购 了 另外 一 家 大 型 的 中 间 件 企业 BEA 公 司 ， 当 完成 对 Sun 公 司 的 收购 之 后 ，Oracle 分 别 从 BEA 和 Sun 中 取得 了 目前 三 大 商业 虚拟 机 的 其 中 两 个 : JRockit 和 
Hotspot，Oracle 宣 布 在 未 来 1 至 2 年 的 时 间 内 ， 将 把 这 两 个 优秀 的 虚拟 机 互相 取长补短 ， 最 终 合 二 为 一 B]。 可 以 预见 在 不 久 的 将 来 ，Java 技 术 体系 将 会 产生 相当 巨大 的 变化 。 






































[中 JDK 从 1.5 版 本 开始 ， 官 方 在 正式 文档 与 宣传 上 已 经 不 再 使 用 类 似 JDK 1.5 的 命名 ， 只 有 程序 员 内 部 使 用 的 开发 版 本 号 (Developet Version， 例 如 java-version 的 输出 ) 中 才 继 续 沿用 1.5、1.6、1.7 的 版 本 号 ， 而 
公开 版 本 号 (Product Version) 则 改 为 JDK 5、JDK 6、JDK 7 的 命名 方式 ， 本 书 为 了 行文 一 致 ， 所 有 场合 统一 采用 开发 版 本 号 的 命名 方式 。 
四 在 本 书 初稿 完成 之 际 ， 己 收 到 确定 消息 证 实 Jigsaw、Lambda 等 项 目 无 法 在 JDK 7 中 发 布 ， 最 早 将 在 JDK8 中 提供 。 


[3] Hot Roekit 项 目的 相关 介绍 : http://hirt.se/presentations/WhatToBxpect.ppt。 


1.4 ”展望 Jjava 技 术 的 未 来 





























在 Java 语 言 诞生 10 周 年 (2005 年 ) 的 SunOne 技 术 大 会 上 ，Java 语 言 之 父 james Gosling 做 过 一 个 题 为 “Java 技 术 的 下 一 个 十 年 ”的 演讲 。 笔 者 不 具备 James Gosling 博 士 那 样 高 屋 建 领 的 视角 ， 这 里 
仅 从 Java 平 台中 几 个 新 生 的 但 已 经 开始 展现 出 蓬勃 之 势 的 技术 发 展 点 来 看 一 下 后 续 1 至 2 个 JDK 版 本 内 的 一 些 很 有 希望 的 技术 重点 . 






































1.4.1 模块 化 























模块 化 是 解决 应 用 系统 与 技术 平台 越 来 越 复杂 、 越 来 越 庞 大 而 产生 的 一 系列 问题 的 一 个 重要 途径 。 无 论 是 开发 人 员 还 是 产品 的 最 终 用户 ， 都 不 希望 为 了 系统 中 的 一 小 块 功 能 而 不 得 不 下 载 、 安 装 、 部 署 
及 维护 整套 庞大 的 系统 。 最 近 几 年 OSGi 技 术 的 迅速 发 展 正 说 明了 通过 模块 化 实现 按 需 部 署 、 降 低 复杂 性 和 维护 成 本 的 需求 是 相当 人 迫切 的 。 
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预计 在 未 来 的 Java 平 台中 ， 将 会 对 模块 化 提供 语法 

















面 的 支持 。 在 Java SE 7 发 展 初期 ， 两 个 重要 的 JSR 曾 经 试图 解决 依赖 关系 管理 问题 ， 分 别 是 JSR-294: java 编程 语言 中 的 改进 模块 性 支持 
































体 实现 方面 ，Java 








(Improved Modularity Support in the Java Programming Language) 和 JSR-277: Java 模 块 系统 (Java Module System) ， 两 者 分 别 关 注 Java 模 块 概念 的 开发 和 部 署 方 面 。 在 : 





图 ) 的 项 目 来 推动 这 两 个 规范 在 Java 平 台中 转变 为 具体 的 实现 。 








SE 7 中 已 建立 了 一 个 名 为 jigsaw ( 拼 


1.4.2 ”混合 语言 
当 单 一 的 Java 语 言 已 经 无 法 满足 当前 软件 的 复杂 需求 时 ， 越 来 越 多 基于 Java 虚 拟 机 的 语言 被 应 用 到 软件 项 目 中 。Java 平 台 上 的 多 语言 混合 编程 正成 为 主流 ， 每 种 语言 都 可 以 针对 自己 擅长 的 方面 更 好 地 
JRuby/Rails， 中 间 层 则 是 Java， 每 个 应 用 层 都 将 使 用 不 同 的 编程 语言 来 完成 ， 而 且 ， 接 口 对 每 一 层 的 开发 者 都 是 透明 


























用 Clojure 语 言 编写 ， 展 示 层 使 


解决 问题 。 试 想 一 下 ， 在 一 个 项 目 之 中 ， 并 行 处 理 | 
用 自己 语言 的 原生 API 一 样 方便 [1]， 因 


的 ， 各 种 语言 之 间 的 交互 不 存在 任何 困难 ， 就 像 使 为 它们 最 终 都 运行 在 一 个 虚拟 机 之 上 。 


图 1-4 中 列举 了 其 中 的 一 部 分 。 这 两 点 证 明 混合 编程 在 











增长 ， 而 运行 在 java 庶 拟 机 之 上 的 语言 数量 也 在 记 速 膨胀， 
项 目 需求 的 一 个 方向 。 











在 最 近 两 年 里 ，Clojure、JRuby、Groovy 等 新 生 语言 的 使 用 人 数 如 同 滚动 的 雪 球 一 | 
我 们 身边 已 经 有 所 应 用 并 被 广泛 认可 。 通 过 特定 领域 的 语言 去 解决 特定 领域 的 问题 是 当前 软件 开发 应 对 日 趋 复杂 的 
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图 1-4 ”可 以 运行 在 JVM 之 上 的 语言 中 








除了 催生 出 大 量 的 新 语言 外 ， 许 多 已 经 有 很 长 历史 的 程序 语言 
量 资本 的 现 有 代码 资产 也 能 被 很 好 地 保护 起 来 。 表 1-1 中 列举 了 常见 语言 的 java 虚拟 机 实现 版 本 。 
表 1-1 常见 语言 的 JVM 实 现 版 本 


也 出 现 了 基于 Java 虚 拟 机 实现 的 版 本 。 这 样 的 混合 编程 对 许多 以 前 使 用 其 他 语言 的 “ 老 ” 程 序 员 也 有 相当 大 的 吸引 力 ， 软 件 企业 投入 了 大 





i 基于 JVM 实现 的 版 本 
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1.4.3 多核 并 行 


如 今 ，CP 


U 硬 件 的 发 





展 方向 已 经 从 高 频率 转变 为 多 核心 ， 随 着 多 核 时 代 的 来 临 ， 软 件 开发 越 来 越 关注 并 行 编程 的 领域 。 早 在 JDK 1.5 之 中 就 已 经 引入 java.util.concurrent 包 实现 了 一 个 粗 粒 度 的 并 发 框 








架 ， 而 JDK 1.7 中 将 会 加 入 的 java.util.concurrent.forkjoin 包 则 是 对 这 个 框架 的 一 次 重要 扩充 。Fork/Join 模 式 是 处 理 并行 编 程 的 一 种 经 典 方法 ， 如 图 1-5 所 示 。 虽 然 不 能 解决 所 有 的 问题 ， 但 是 在 它 的 适用 范 





围 之 内 ， 能 够 轻松 地 利 












































多 个 CPU 核心 提供 的 计算 资源 来 协作 完成 一 个 复杂 的 计算 任务 。 通 过 利用 Fork/jJoin 模 式 ， 我 们 能 够 更 加 顺畅 地 过 渡 到 多 核 的 时 代 。 








| 调用 一 一 一 > 


返回 一 一 一 一 > 


eS- Task 0-2. 


EE A NCNM 








在 JDK 外 围 
错 方式 并 行 处理 











1.4.4 进一步 丰富 语法 


图 1-5 ”Fork/Join 模 式 示意 图 器 








， 也 出 现 了 专 为 满足 并 行 计算 需求 的 计算 框架 ， 如 Apache 的 Hadoop Map/Reduce， 这 是 一 个 简单 易 懂 的 并 行 框架 ,能够 运行 在 由 上 和 干 个 商用 机 器 组 成 的 大 型 集群 上 ， 并 能 以 一 种 可 靠 的 容 
上 TB 级 别 的 数据 集 。 另 外 ， 还 出 现 了 诸如 Scala、Clojure 及 Erlang 等 天 生 就 具备 并 行 计算 能 力 的 语言 。 














JDK 1.5 曾 经 对 Java 语 法 进行 了 一 次 扩充 ， 这 次 扩充 加 入 了 自动 装 箱 、 泛 型 、 动 态 注解 、 枚 举 、 可 变 长 参数 、 遍 历 循 环 等 语法 特性 ， 使 得 Java 语 言 的 精确 性 和 易 用 性 有 了 很 大 的 进步 。 在 JDK 1.7 (由 于 
进度 压力 ， 许 多 改进 已 被 推迟 至 JDK 1.8) 中 ， 将 会 对 Java 语 法 进行 另 一 次 大 规模 的 扩充 。Sun (Oracle) 为 此 发 起 了 Coin 子 项 目 内 来 统一 处 理 对 Java 语 法 的 细节 修改 ， 如 二 进 制 数 的 原生 支持 、 在 switch 语 


句 中 支持 字符 











、“< >” 操 作 符 、 异 常 处 理 的 改进 、 简 化 变 长 参数 方法 调 











、 面 向 资源 的 try-catch-finally 语 句 等 都 是 在 Coin 项 目 之 中 提交 的 内 容 。 另 外 ，JSR-335 (Lambda Expressions for the Java 


TM Programming Language) 中 定义 的 Lambda 表 达 式 中 也 将 对 Java 的 语法 和 语言 习惯 产生 很 大 的 影响 ， 函 数 式 编程 可 能 会 成 为 主流 。 


1.4.5 64 位 虚拟 机 
































几 年 之 前 ， 主 流 的 CPU 就 开始 支持 64 位 架构 。Java 虚 拟 机 也 在 很 早 之 前 就 推出 了 支持 64 位 系统 的 版 本 。 但 Java 程 序 运行 在 64 位 虚拟 机 上 需要 付出 比较 大 的 额外 代价 : 首先 是 内 存 问 题 ， 由 于 指针 膨胀 和 
各 种 数据 类 型 对 齐 补 白 的 原因 ， 运 行 于 64 位 系统 上 的 Java 应 用 需要 消耗 更 多 的 内 存 ， 通 常 要 比 32 位 系统 额外 增加 10%~30% 的 内 存 消耗 其 次 是 多 个 机 构 的 测试 结果 显示 ，64 位 虚拟 机 的 运行 速度 在 各 个 测 
试 项 上 几乎 都 全 面 落后 于 32 位 虚拟 机 ， 两 者 大 约 有 15% 左 右 的 性 能 差距 。 

































































但 是 在 Java EE 方面 ， 企 业 级 应 用 经 常 需要 使 用 超过 4G 的 内 存 ， 对 于 64 位 虚拟 机 的 需求 是 非常 迫切 的 ， 由 于 上 述 的 原因 ， 许 多 企业 应 用 都 仍然 选择 使 用 虚拟 集群 等 方式 继续 在 32 位 虚拟 机 中 进行 部 署 。 
Sun 也 注意 到 了 这 些 问题 ， 并 做 出 了 一 些 改善 ， 在 JDK 1.6Update 14 之 后 ,提供 了 普通 对 象 指针 压缩 功能 (-XX: +UseCompressedOops) ， 在 解释 器 解释 字 节 码 时 ， 植 入 压缩 指令 以 节省 内 存 消耗 。 随 
着 硬件 的 进一步 发 展 ， 计 算 机 终究 会 完全 过 渡 到 64 位 的 时 代 ， 这 是 一 件 毫 无 疑问 的 事情 ， 主 流 的 虚拟 机 应 用 终究 也 会 从 32 位 发 展 至 64 位 ， 而 虚拟 机 对 64 位 的 支持 也 将 会 进一步 完善 。 







































































四 在 同一 个 虚拟 机 上 运行 的 其 他 语言 与 Java 语 言 之 间 的 交互 一 般 都 比较 容易 ， 但 非 Java 语 言 之 间 的 交互 一 般 都 比较 繁琐 。dynalang 项 目 (http://dynalang.sourceforge.net/) 就 是 为 了 解决 这 个 问题 而 出 现 的 。 
[四 图 片 来 源 : http://wikis.sun.com/download/attachments/1 641831 9/OOW-2009+Towards+A+Universa+VM.pdf。 

[3] 图 片 来 源 : http://www.ibm.com/developerworks/cn/java/j-lo-forkjoin/。 

[Coin 项 目 主页 : http://wikis.sun.com/ display/ProjectCoin/ Home。 


[5] Lambda 项 目 主页 : http://openjdk.java.net/projects/lambda/。 


1.5 ”实战 : 自己 编译 JDK 


想 要 一 探 jDK 内 部 的 实现 机 制 ， 最 便捷 的 路 径 之 一 就 是 自己 编译 一 套 /DK。 通 过 阅读 和 跟踪 调试 JDK 源 码 去 了 解 Java 技 术 体系 的 原理 ， 虽 然 门槛 会 高 一 点 ， 但 肯定 会 比 阅读 各 种 文章 、 书 籍 更 加 容易 贴近 
本 质 。 另 外 ，JDK 中 的 很 多 底层 方法 都 是 Native 的 ， 当 需要 跟踪 这 些 方 法 的 运作 或 对 JDK 进 行 Hack 的 时 候 ， 都 需要 编译 一 套 自己 的 JDK。 









































现在 网 络 上 有 不 少 开源 的 JDK 实 现 可 供 选 择 ， 如 Apache Harmony、OpenJDK 等 。 考 虑 到 Sun 系 列 的 JDK 是 现在 使 用 得 最 广泛 的 JDK 版 本 ， 本 书 选 择 了 OpenJDK 进 行 这 次 编译 实战 。 











1.5.1 ”获取 JDK 源 码 





























首先 确定 要 使 用 的 JDK 版 本 ，OpenJDK 6 和 OpenJDK 7 都 是 开源 的 ， 源 码 都 可 以 在 它们 的 主页 (http://openjdk.java.net/) 上 找到 ，OpenJDK 6 的 源码 其 实 是 从 OpenJDK 7 的 某 个 基线 中 引出 的 , 然 
后 剥离 掉 JDK 1.7 相 关 的 代码 ， 从 而 得 到 一 份 可 以 通过 TCK 6 的 JDK 1.6 实 现 ， 因 此 直接 编译 OpenJDK 7 会 更 加 “ 原 汁 原味 ”一 些 ， 其 实 这 两 个 版 本 的 编译 过 程 差异 并 不 大 。 










































































获取 源码 有 两 种 方式 : 一 种 是 通过 Mercurial 代 码 版 本 管理 工具 从 Repository 中 直接 取得 源码 (Repository 地 址 : http://hg.openjdk.java.net/jdk7/jdk7) ， 这 是 最 直接 的 方式 ， 从 版 本 管理 中 看 变更 
轨迹 比 看 任何 Release Note 都 来 得 实在 ， 不 过 坏处 自然 是 太 麻 烦 了 一 些 ， 尤 其 是 Mercurial 远 不 如 SVN、 ClearCase 或 CVS 之 类 的 版 本 控制 工具 那样 普及 ; 另外 一 种 就 是 直接 下 载 官方 打包 好 的 源码 包 了 ， 可 
以 从 Source Releases 页 面 (地 址 : http://download.java.net/openjdk/jdk7/) 取得 打包 好 的 源码 ， 一 般 来 说 大 概 一 个 月 左右 会 更 新 一 次 ， 虽 然 不 够 及 时 ， 但 的 确 方便 了 许多 。 笔 者 下 载 的 是 OpenJDK 
7Early Access Source Build b121 版 ，2010 年 12 月 9 日 发 布 的 ， 大 概 81.7MB， 解 压 后 约 308MB。 














































































































1.5.2 ”系统 需求 


如 果 可 能 ， 笔 者 建议 尽量 在 Linux 或 Solaris 上 构建 OpenJDK， 这 要 比 在 Windows 平 台 上 轻松 许多 ， 而 且 网 上 能 找到 的 资料 绝 大 部 分 都 是 在 Linux 上 编译 的 。 如 果 一 定 要 在 Windows 平 台 上 编译 ， 建 议 认 
真 阅读 一 下 源码 中 的 README-builds.htm 文 档 (无 论 是 在 OpenJDK 网 站 上 ， 还 是 在 下 载 的 源码 包 里 面 都 有 这 份 文档 )  ， 因 为 编译 过 程 中 需要 注意 的 细节 非常 多 。 虽 然 不 至 于 像 文 档 上 所 描述 的 [1 那么 夸 
张 ， 但 是 如 果 大 家 是 第 一 次 编译 ， 在 上 面 耗费 一 整 天 乃至 更 多 的 时 间 都 很 正常 。 



































本 书 在 本 次 实战 中 演示 的 是 在 32 位 Windows 7 平台 下 编译 x86 版 的 OpenJDK (也 就 是 32 位 的 JDK) ， 如 果 需 要 编译 x64 版 ， 那 毫 无 疑问 也 需要 一 个 64 位 的 操作 系统 。 另 外 ， 编 译 涉及 的 所 有 文件 都 必须 
存放 在 NTFS 格 式 的 文件 系统 中 ， 因 为 FAT32 格 式 无 法 支持 大 小 写 敏感 的 文件 名 。 在 官方 文档 上 写 道 : 编译 至 少 需要 512MB 的 内 存 和 600MB 的 磁盘 空间 。 如 果 大 家 耐心 很 好 的 话 ，512MB 的 内 存 基本 上 也 可 
以 凑合 使 用 ， 不 过 600MB 的 磁盘 空间 仅仅 是 指 存放 OpenjDK 源 码 和 相关 依赖 项 的 空间 ， 要 完成 编译 ，600MB 肯 定 是 无 论 如 何 都 不 够 的 ， 这 次 实战 中 所 下 载 的 工具 、 依 赖 项 、 源 码 ， 全 部 安装 和 解压 完成 最 
少 (最 少 是 指 只 下 载 C+ + 编译 器 ， 不 下 载 VS 的 IDE) 需要 超过 1GB 的 空间 。 







































































对 系统 的 最 后 一 点 要 求 就 是 所 有 的 文件 ， 包 括 源码 和 依赖 项 目 ， 都 不 要 放 在 包含 中 文 或 空格 的 目录 里 面 ， 这 样 做 不 是 一 定 不 可 以 ， 只 是 这 样 会 为 后 续 建 立 CYGWIN 环 境 带 来 很 多 额外 的 工作 ， 这 是 由 于 
Linux 和 Windows 的 磁盘 路 径 存在 差别 ， 我 们 也 没有 必要 自己 给 自己 找 麻烦 。 





1.5.3 ”构建 编译 环境 








准备 编译 环境 的 第 一 步 是 安装 一 个 CYGWINI 外 。 这 是 一 个 在 Windows 平 台 下 模拟 Linux 运 行 环境 的 软件 ， 提 供 了 一 系列 的 Linux 命 令 支 持 。 需 要 CYGWIN 的 原因 是 因为 在 编译 中 要 使 用 GNU Make 来 执 
行 Makefile 文 件 (C/C++ 程序 员 肯 定 很 熟悉 ， 如 果 只 使 用 Java， 把 它 当做 C++ 版 本 的 ANT 看 待 就 可 以 了 ) 。 安 装 CYGWIN 时 不 能 直接 采用 默认 安装 方式 ， 因 为 表 1-2 中 所 示 的 工具 在 默认 情况 下 都 不 会 安 
装 ， 但 又 是 编译 过 程 中 需要 的 ， 因 此 要 在 图 1-6 的 安装 界面 中 进行 手工 选择 。 



























































表 1-2 需要 手工 选择 安装 的 CYGWIN 工 具 





文件 名 分 类 包 描 述 





ar.exe Devel binutils The GNU assembler, linker and binary utilities 

make.exe Devel make The GNU version of the 'make' utility built for CYGWIN. 
m4.exe Interpreters m4 GNU implementation of the traditional Unix macro processor 
cpio.exe Utils cpio A program to manage archives of files 

gawk.exe Utils awk Pattern-directed scanning and processing language 

file.exe Utils file Determines file type using 'magic' numbers 

zip.exe Archive zip Package and compress (archive) files 

unzip.exe Archive unzip Extract compressed files in a ZIP archive 

free.exe System procps Display amount of free and used memory in the system 





CYGWIN 安 装 时 的 定制 包 选 择 界面 如 图 1-6 所 示 。 


[ 0 Cyevwin Setup — Select Packages | 


Select Packages 
Select packages to install 


Search | 


Category Current | 人 Package 
日 所 1 Default 


Accessibility ¢Y Default 
日 Admin #¥ Default 








attr: Utilities for mar 

cron: Vixie’ s cron. 

cyerunsrv: NHI/W2K servi 

libattrl: Shared lib fc 

shutdown: Shutdown, ret 

sysloe-ne: Next generat 
Archive 各 Default 


Hide obsolete packages 








图 1-6 CYGWIN 安装 界面 


建立 编译 环境 的 第 二 步 是 安装 编译 器 。JDK 中 最 核心 的 代码 (Java 虚 拟 机 及 JDK 中 Native 方 法 的 实现 等 ) 是 使 用 C++ 语 言及 少量 的 C 语 言 编写 的 ， 官 方 文档 中 说 它们 的 内 部 开发 环境 是 在 Microsoft 
Visual Studio C++2003 (VS2003) 中 进行 编译 的 ， 同 时 也 在 Microsoft Visual Studio C++2010 (VS2010) 中 测试 过 ， 所 以 最 好 只 选择 这 两 个 编译 器 中 的 一 个 进行 编译 。 如 果 选 择 VS2010， 那 么 在 编译 
器 之 中 已 经 包含 了 Windows SDK v 7.0a， 和 否则 可 能 还 要 自己 去 下 载 这 个 SDK， 并 且 更 新 PlatformSDK 目 录 。 由 于 笔者 没有 购买 Visual Studio 2010 的 IDE， 所 以 仅仅 下 载 了 VS2010Express 中 提取 出 来 的 
C++ 编译 器 ， 这 部 分 是 免费 的 ， 但 单独 安装 好 编译 器 比较 麻烦 ， 建 议 读者 选择 使 用 整套 Visual Studio C+ +2010 或 Visual Studio C+ +2010Express 版 进行 编译 。 


注意 CYGWIN 和 VS2010 安 装 之 后 都 会 在 操作 系统 的 PATH 环 境 变 量 中 写 入 自己 的 bin 目 录 路 径 ， 必 须 检查 并 保证 VS2010 的 bin 目 录 一 定 要 在 CYGWIN 的 bin 目 录 之 前 ， 因 为 这 两 个 软件 的 bin 目 录 之 中 各 自 
都 有 个 连接 器 “link.exe”， 但 是 只 有 VS2010 中 的 连接 器 可 以 完成 OpenJDK 的 编译 。 


准备 JDK 编 译 环境 的 第 三 步 是 下 载 一 个 已 经 编译 好 的 JDK。 这 听 起 来 也 许 有 点 滑稽 一 一 要 用 鸡蛋 孵 小 鸡 还 真得 先 养 一 只 母 鸡 呀 ? 但 仔细 想 想 其 实 这 个 步骤 很 合理 : 因为 JDK 包 含 的 各 个 部 分 (HotSpot、 
JDK API、JAXWS、JAXP.…..) 有 的 是 使 用 C++ 编 写 的 ， 而 更 多 的 代码 则 是 使 用 Java 自 身 实现 的 ， 因 此 编译 这 些 Java 代 码 需 要 用 到 一 个 可 用 的 JDK， 官 方 称 这 个 JDK 为 “Bootstrap JDK”。 如 果 编 译 
OpenJDK 7，Bootstrap JDK 必 须 使 用 JDK6Update 14 或 之 后 的 版 本 ， 笔 者 选用 的 是 JDK6Update 21。 









































最 后 一 个 步骤 是 下 载 一 个 Apache ANT，JDK 中 的 Java 代 码 部 分 都 是 使 用 ANT 脚 本 进行 编译 的 ，ANT 版 本 要 求 在 1.6.5 以 上 ， 这 部 分 是 Java 的 基础 知识 ， 对 本 书 的 读者 来 说 应 该 没有 难度 ， 笔 者 就 不 再 详 


1.5.4 “准备 依赖 项 


前 面 说 过 ，OpenJDK 中 开放 的 源码 并 没有 达到 100%， 还 有 极 少量 的 无 法 开源 的 产权 代码 存在 。OpenJDK 承 诺 日 后 将 逐步 使 用 开源 实现 来 蔡 换 掉 这 部 分 产权 代码 ， 但 至 少 在 今天 ， 编 译 JDK 还 需要 这 部 
分 闭 源 包 ， 官 方 称 之 为 “JDK Plug”D， 它 们 从 前 面 的 Source Releases 页 面 就 可 以 下 载 到 。 在 Windows 平 台 下 的 JDK Plug 是 以 Jar 包 的 形式 提供 的 ， 通 过 下 面 这 条 命令 可 以 安装 它 : 





java -jar jdk-7-ea-plug-b121-windows-i586-09 dec 2010.jar 











运行 后 将 会 显示 如 图 1-7 所 示 的 协议 ， 点 击 ACCEPT 接 受 协 议 ， 然 后 把 Plug 安 装 到 指定 目录 即 可 。 安 装 完毕 后 建立 一 个 环境 变量 “ALT_BINARY_PLUGS_PATH”， 变 量 值 为 此 JDK Plug 的 安装 路 径 ， 后 
面 编译 程序 时 需要 用 到 它 。 

















除了 要 用 到 JDK Plug 外 ， 编 译 时 还 需要 引用 JDK 的 运行 时 包 ， 它 是 编译 JDK 中 用 Java 代 码 编写 的 那 部 分 所 需要 的 ， 如 果 仅仅 是 想 编译 一 个 HotSpot 虚 拟 机 ， 则 可 以 不 用 。 官 方 文档 把 这 部 分 称 之 
为 “Optional Import JDK”， 可 以 直接 使 用 前 面 的 Bootstrap JDK 的 运行 时 包 ， 我 们 需要 建立 一 个 名 为 “ALT JDK_IMPORT_PATH” 的 环境 变量 指向 JDK 的 安装 目录 。 








第 三 步 是 安装 一 个 大 于 2.3 版 的 FreeType 内 ， 这 是 一 个 免费 的 字体 泻 染 库 ，JDK 的 Swing 部 分 和 JConsole 这 类 工具 要 使 用 到 它 。 安 装 好 后 建立 两 个 环境 变 
量 “ALT_ FREETYPE LIB_ PATH” 和 “ALT_FREETYPE_HEADERS_PATH”， 分 别 指向 FreeType 安 装 目录 下 的 bin 目 录 和 include 目 录 。 另 外 ， 还 有 一 点 官方 文档 没有 提 到 但 必须 要 做 的 事情 是 把 FreeType 的 
bin 目 录 加 入 到 PATH 环境 变量 中 。 


Binary License for OpenJDK 


Sun Microsystems, Inc. Binary Code License Agreement 


SUN MICROSYSTEMS, INC. CSUN") IS WILLING TO LICENSE THE SOFTWARE TO YOU 
ONLY UPON THE CONDITION THAT YOU ACCEPT ALL OF THE TERMS CONTAINED IN THIS 
BINARY CODE LICENSE AGREEMENT (CAGREEMENT"). PLEASE READ THE AGREEMENT 
CAREFULLY. BY DOWNLOADING OR INSTALLING THIS SOFTWARE, YOU ACCEPT THE 
FULL 

ERMS OF THIS AGREEMENT. 


ACCEPT DECLINE 





图 1-7 JDK Plug 安装 协议 


第 四 步 是 下 载 Microsoft DirectX 9.0SDK (Summer 2004) ， 安 装 后 大 约 有 298MB， 在 微软 官方 网 站 上 搜索 一 下 就 可 以 找到 下 载 地 址 ， 它 是 免费 的 。 安 装 后 建立 环境 变量 “ALT_DXSDK_PATH” 指 向 
DirectX 9.0SDK 的 安装 目录 。 


第 五 步 是 去 寻找 一 个 名 为 “MSVCR100.DLL” 的 动态 链接 库 ， 如 果 读 者 在 前 面 安装 了 全 套 的 Visual Studio 2010， 那 这 个 文件 在 本 机 就 能 找到 ， 否 则 上 网 搜索 一 下 也 能 找到 单独 的 下 载 地 址 ， 大 概 有 
744KB。 建 立 环境 变量 “ALT_MSVCRNN_DLL_PATH” 指向 这 个 文件 所 在 的 目录 。 如 果 读者 选择 的 是 VS2003， 这 个 文件 名 应 当 为 “MSVCR73.DLL”。 很 多 软件 中 都 包含 有 这 个 文件 ， 如 果 找 不 到 ， 前 面 
下 载 的 “Bootstrap JDK” 的 bin 目 录 中 应 该 也 有 一 个 ， 直 接 拿 来 用 吧 。 























1.5.5 ”进行 编译 
现在 ,需要 下 载 的 编译 环境 和 依赖 项 目 都 准备 齐全 了 ， 最 后 我 们 还 需要 对 系统 进行 一 些 设置 以 便 编译 能 够 顺利 通过 。 


首先 执行 VS2010 中 的 VCVARS32.BAT， 这 个 批 处 理 文件 的 主要 目的 是 设置 INCLUDE、LIB 和 PATH 这 几 个 环境 变量 。 如 果 大 家 和 笔者 一 样 只 是 下 载 了 编译 器 ， 则 需要 手工 设置 它们 ， 各 个 环境 变量 的 设 
置 值 可 以 参考 代码 清单 1-1 中 的 内 容 。 批 处 理 运行 完 之 后 建立 “ALT_ COMPILER_PATH” 环 境 变量 ， 让 Makefile 知 道 在 哪里 可 以 找到 编译 器 。 


再 建立 “ALT_ BOOTDIR” 和 “ALT JDK_IMPORT_PATH” 两 个 环境 变量 ， 指 向 前 面 提 到 的 JDK 1.6 的 安装 目录 ,建立 “ANT_HOME” 指 向 Apache ANT 的 安装 目录 。 建 立 的 环境 变量 很 多 ， 为 了 避免 
遗漏 ， 笔 者 写 了 一 个 批 处 理 文件 以 供 读者 参考 ， 如 代码 清单 1-1 所 示 。 


代码 清单 1-1 环境 变量 设置 





SET ALT BOOTDIR=D:/_DevSpace/JDK 1.6.0 21 

SET ALT BINARY PLUGS PATH=D:/jdkBuild/jdk7plug/openjdk-binary-plugs 
SET ALT JDK IMPORT PATH=D:/ DevSpace/JDK 1.6.0 21 

SET ANT HOME=D:/jdkBuild/apache-ant-1.7.0 

SET ALT MSVCRNN DLL, PATH=D:/jdkBuild/msvcr100 


SET ALT DXSDK PATH=D:/jdkBuild/msdxsdk 

SET ALT COMPILER PATH=D:/jdkBuild/vcpp2010.x86/bin 

SET ALT FREETYPE HEADERS PATH=D:/jdkBuild/freetype-2.3.5-1-bin/include 

SET ALT FREETYPE LIB PATH=D: /jdkBuild/freetype-2.3.5-1-bin/bin 

SET INCLUDE=D:/jdkBuild/vcpp2010.x86/include;D:/jdkBuild/vcpp2010.x86/sdk/ 
Include; $INCLUDES 

SET LIB=D:/jdkBuild/vcpp2010.x86/1ib;D:/jdkBuild/vcpp2010.x86/sdk/Lib; $LIBS 
SET LIBPATH=D: /jdkBuild/vcpp2010.x86/1ib; %LIBS 

SET PATH=D:/jdkBuild/vcpp2010.x86/bin;D:/jdkBuild/vcpp2010.x86/d11/x86;D:/ 
Software/OpenSource/cygwin/bin; %ALT FREETYPE LIB PATH%S;%PATHS 





Core i5/4GB RAM 的 机 器 编译 整个 JDK 大 概 需要 
译 遗 留 的 文件 。 


最 后 还 需要 再 做 两 项 调整 ， 官 方 文档 没有 说 明 这 两 项 ， 但 是 必须 要 做 完 才能 保证 编译 过 程 顺利 完成 : 一 项 是 取消 环境 变量 JAVA_HOME， 这 点 很 简单 ;另外 一 项 是 尽量 在 英文 的 操作 系统 上 编译 ， 估 计 














大 部 分 读者 会 感到 比较 为 难 吧 。 如 果 不 能 在 英文 的 系统 上 编译 ， 就 把 系统 的 文字 格式 调整 为 “英语 (美国 ) ”， 在 控制 面板 中 的 “区 域 和 语言 ”选项 的 第 一 个 页 签 中 可 以 设置 。 如 果 这 个 设置 还 不 能 更 改 就 
建立 一 个 “BUILD_CORBA” 的 环境 变量 ， 将 值 设置 为 false， 取 消 编译 CORBA 部 分 。 否 则 Java IDL (idlj.exe) 为 *.idI 文 件 生成 CORBA 适 配器 代码 的 时 候 会 产生 中 文 注释 ， 而 这 些 中 文 注释 会 因为 字符 集 的 
问题 而 导致 编译 失败 。 























完成 了 上 述 繁琐 的 准备 工作 之 后 ， 我 们 终于 可 以 开始 编译 了 。 进 入 控制 台 (Cmd.exe) 后 运行 刚才 准备 好 的 设置 环境 变量 的 批 处 理 文件 ， 然 后 输入 bash 进 入 Bourne Again Shell 环 境 (习惯 sh 或 ksh 的 
， 笔 者 下 载 的 OpenJDK 7B121 版 没有 这 个 文件 了 ， 所 以 可 直接 输入 make sanity 来 检查 我 们 前 面 所 做 的 设置 


读者 请 自 便 ) 。 如 果 JDK 的 安装 源码 中 存在 “jdk_generic_profile.sh” 这 个 Shell 脚 本 ， 先 执行 它 
是 否 全 部 正确 。 如 果 一 切 顺利 ， 几 秒 钟 之 后 会 有 类 似 代码 清单 1-2 所 示 的 输出 。 











代码 清单 1-2 make sanity 检 查 


D:\jdkBuild\openjdk7>bash 

bash-3.2$ make sanity 

cygwin warning: 
MS-DOS style path detected: C:/Windows/system32/wscript .exe 
Preferred POSIX equivalent is: /cygdrive/c/Windows/system32/wscript .exe 
CYGWIN environment variable option "nodosfilewarning" turns off this warning. 
Consult the user's guide for more details about POSIX paths: 

http://cygwin.com/cygwin-ug-net/using.html#using-pathnames 
(cd ./jdk/make && \ 


OpenJDK-specific settings: 
FREETYPE HEADERS PATH = D:/jdkBuild/freetype-2.3.5-1-bin/include 
ALT FREETYPE HEADERS PATH = D:/jdkBuild/freetype-2.3.5-1-bin/include 
FREETYPE LIB PRTH = D:/jdkBuild/freetype-2.3.5-1-bin/bin 
ALT FREETYPE LIB PATH = D:/jdkBuild/freetype-2.3.5-1-bin/bin 
OPENJDK Import Binary Plug Settings: 
IMPORT BINARY PLUGS = true 
BINARY PLUGS JARFILE = D:/jdkBuild/jdk7plug/openijdk-binary-plugs/jre/lib/rt- 
closed.jar 
ALT BINARY PLUGS JARFILE = 
BINARY PLUGS PATH = D: /jakBui1d/jdk71plug/openj ok binary_pligs 
ALT BINARY PLUGS PATH = D:/jdkBuild/jdk7plug/openjdk-binary-plugs 
BUILD BINARY PLUGS PATH = J:/re/jdk/1.7.0/promoted/latest/openjdk/binaryplugs 
ALT BUILD BINARY PLUGS_PATH = 
PLUG LIBRARY NAMES = 
Previous JDK settings: 
PREVIOUS RELEASE PATH = USING-PREVIOUS RELEASE IMAGE 
ALT_ PREVIOUS RELFASE PATH = 
PREVIOUS JDK VERSION = 1.6.0 
ALT PREVIOUS JDK VERSION = 
PREVIOUS JDK FILE = 
ALT PREVIOUS JDK FILE = 
PREVIOUS JRE FILE = 
ALT PREVIOUS JRE FILE = 
PREVIOUS _ RELEASE IMAGE = D:/ DevSpace/ on 1.6.0 21 
ALT PREVIOUS RELEASE, _ IMAGE = 
Sanity check passed. 





Makefile 的 Sanity 检 查 过 程 输出 了 编译 所 需 的 所 有 环境 变量 ， 如 果 看 到 “Sanity check passed.” 说 明 检查 过 程 通 过 了 ， 可 以 输入 “make” 执 行 整个 Makefile， 然 后 去 喝 杯 下 午 茶 再 回来 。 笔 者 的 











半 个 多 小 时 。 如 果 失败 ， 则 需要 根据 系统 输出 的 失败 原因 ， 回 头 再 检查 一 下 对 应 的 设置 ， 并 且 最 好 在 下 一 次 编译 之 前 先 执行 “make clean” 来 清理 掉 上 次 编 








编译 完成 之 后 ， 打 开 OpenJDK 源 码 下 的 build 目 录 ， 看 看 是 不 是 已 经 有 一 个 编译 好 的 JDK 在 那里 等 着 了 ? 执行 一 下 “java-version” ， 看 到 以 


1.6 ”本章 小 结 


[3] 在 2011 年 ，JD 区 Plug 已 经 不 在 需要 了 ， 但 笔者 在 实战 时 使 用 的 是 2010 年 12 月 9 日 发 布 的 OpenJDKb121 版 ， 还 是 需要 这 些 JDK Plug。 
[各 FreeType 主页 : http://www.freetype.org/。 


本 章 介绍 了 Java 技 术 体 系 的 过 去 、 现 在 和 未 来 的 发 展 趋势 ， 并 通过 实践 的 方式 介绍 了 如 何 自己 来 独立 编译 一 个 OpenJDK 7。 作 为 全 书 的 引言 





的 来 龙 去 脉 后 ， 后 面 的 章节 将 分 为 四 部 分 去 讲解 Java 在 内 存 管理 、Class 文 件 结构 与 执行 引擎 、 编 














第 二 部 分 


第 3 章 ”垃圾 收集 器 与 内 存 分 配 策 
第 4 章 ”虚拟 机 性 能 监控 与 故障 处 理工 具 


第 5 章 ” 调 优 案 例 分 析 与 实战 





译 器 优化 和 多 线程 并 发 方面 的 实现 原理 。 











自动 内 存 管 理 机 制 





自己 的 机 器 命名 的 JDK 了 吧 ， 很 有 成 就 感 吧 ? 














[1] Building the source code for the JDK requires a high level of technical expertise.Sun provides the source code primarily for technical experts who want to conduct research. (编译 [DK 需要 很 高 的 专业 技术 ，Sun 提 供 JDK 源 
码 是 为 了 技术 专家 进行 研究 之 用 ) 
[2 CYGWIN 下 载 地 址 : http://www.cygwin.com/ 。 


部 分 ， 本 章 建立 了 后 文 研究 所 必需 的 环境 。 在 了 解 Java 技 术 


第 2 章 ”Java 内 存 区 域 与 内 存 溢出 异常 


本 章 主要 内 容 





“概述 


“ 运行 时 数据 区 域 


“对象 访 问 


“ 实战 : OutOfMemoryError 异 常 








Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 的 高 墙 ， 墙 外 面 的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 























2.1 概述 
































对 于 从 事 C 和 C++ 程序 开发 的 开发 人 员 来 说 ， 在 内 存 管理 领域 ， 他 们 既是 拥有 最 高 权力 的 皇帝 ， 又 是 从 事 最 基础 工作 的 劳动 人 民 一 一 既 拥 有 每 一 个 对 象 的 “所 有 权 ”， 又 担负 着 每 一 个 对 象 生命 开始 到 




















终结 的 维护 责任 。 














对 于 Java 程 序 员 来 说 ， 在 虚拟 机 的 自动 内 存 管理 机 制 的 帮助 下 ， 不 再 需要 为 每 一 个 new 操 作 去 写 配 对 的 delete/free 代 码 ， 而 且 不 容易 出 现 内 存 泄漏 和 内 存 溢出 问题 ， 看 起 来 由 虚拟 机 管理 内 存 一 切 都 很 















































美好 。 不 过 ， 也 正 是 因为 Java 程 序 员 把 内 存 控制 的 权力 交 给 了 Java 虚 拟 机 ， 一 旦 出 现 内 存 泄 漏 和 溢出 方面 的 问题 ， 如 果 不 了 解 虚 拟 机 是 怎样 使 用 内 存 的 ， 那 排查 错误 将 会 成 为 一 项 异常 艰难 的 工作 。 


























本 章 是 第 二 部 分 的 第 1 章 ， 笔 者 将 从 概念 上 介绍 Java 虚 拟 机 内 存 的 各 个 区 域 ， 讲 解 这 些 区 域 的 作用 、 服 务 对 象 以 及 其 中 可 能 产生 的 问题 ， 这 是 翻越 虚拟 机 内 存 管 理 这 堵 围墙 的 第 一 步 。 




















2.2 ”运行 时 数据 区 域 





















































赖 用 户 线程 的 启动 和 结束 而 建立 和 销毁 。 根 据 《Java 虚 拟 机 规范 (第 2 版 ) 》 的 规定 ，Java 虚 拟 机 所 管理 的 内 存 将 会 包括 以 下 几 个 运行 时 数据 区 域 ， 如 图 2-1 所 示 。 




















运行 时 数据 区 


方法 区 庶 气 机 村 本 地 方法 村 


Hatiwe Method 


Method Area Wh Stack Stack 


程序 计数 翅 


Pro 如 am Counter Reelster 


加 》> | 本地 库 接口 区 本 地 方法 库 


| | 由 所 有 线程 共享 的 数据 区 
[|] 线程 隔离 的 数据 区 


图 2-1 Java 庶 拟 机 运行 时 数据 区 








执行 引擎 


2.2.1 ”程序 计数 器 


ava 虚 拟 机 在 执行 Java 程 序 的 过 程 中 会 把 它 所 管理 的 内 存 划分 为 若干 个 不 同 的 数据 区 域 。 这 些 区 域 都 有 各 自 的 用 途 ， 以 及 创建 和 销毁 的 时 间 ， 有 的 区 域 随 着 虚拟 机 进程 的 启动 而 存在 ， 有 些 区 域 则 是 依 


程序 计数 器 (Program Counter Register) 是 一 块 较 小 的 内 存 空间 ， 它 的 作用 可 以 看 做 是 当前 线程 所 执行 的 字 节 码 的 行 号 指示 器 。 在 虚拟 机 的 概念 模型 呈 
， 字 节 码 解释 器 工作 时 就 是 通过 改变 这 个 计数 器 的 值 来 选取 下 一 条 需要 执行 的 字 节 码 指令 ， 分 支 、 循 环 、 跳 转 、 异 常 处 理 、 线 程 恢 复 等 基础 功能 都 需要 依赖 这 个 计数 器 来 完成 。 


更 高 效 的 方式 去 实现 ) 


由 
了 线程 切换 后 能 恢复 到 正确 的 执行 位 





， 每 条 线程 都 需要 有 一 个 独立 





如 
虚拟 机 





区 域 。 





规范 中 没有 规定 任何 OutOfMemoryError 情 况 的 


2.2.2 Java 虚拟 机 栈 


与 程序 计数 器 一 样 ，Java 庶 拟 机 
个 栈 帧 (Stack Framel1) 用 于 存储 








经 常 有 人 把 Java 内 存 
关系 最 密切 的 内 存 区 域 是 这 两 块 。 其 中 所 指 的 “ 堆 ” 在 


户 ; 
5] 
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局 部 变量 表 存 放 了 编译 期 可 知 





















































能 是 一 个 指向 对 象 起 始 地 址 的 引用 指针 ， 也 可 能 指向 一 个 代表 对 象 的 
其 中 64 位 长 度 的 long 和 double 类 型 的 数据 会 占用 2 个 局 部 变量 空间 (Slot) ， 其 余 的 数据 类 型 只 占 
配 多 大 的 局 部 变量 空间 是 完全 确定 的 ， 在 方法 运行 期 间 不 会 改变 局 部 变量 表 的 大 小 。 





局 部 变量 表 、 操 作 栈 、 动 态 链接 、 


的 各 种 基本 数据 类 型 (boolean、byte、char、short、int、float、 








方法 出 





虚拟 机 栈 ， 或 者 说 是 虚拟 机 栈 中 的 








局 部 变量 表 部 分 。 








于 Java 虚 拟 机 的 多 线程 是 通过 线程 轮流 切换 并 分 配 处 理 器 执行 时 间 的 方式 来 实现 的 ， 在 任何 一 个 确定 的 时 刻 ， 一 个 处 理 器 (对 于 多 核 处 理 器 来 说 是 一 个 内 核 ) 只 会 
的 程序 计数 器 ， 各 条 线程 之 间 的 计数 器 互 不 影响 ， 独 立 存储 ， 我 们 称 这 类 内 存 


果 线程 正在 执行 的 是 一 个 Java 方 法 ， 这 个 计数 器 记录 的 是 正在 执行 的 虚拟 机 字 节 码 指令 的 地 址 ， 如 果 正 在 执行 的 是 Natvie 方 法 ， 这 个 计数 器 值 则 为 空 (Undefined) 。 此 内 存 


ong、double) 、 对 象 引用 (reference 类 型 ， 它 不 等 同 ] 


有 〈 仅 是 概念 模型 ， 各 种 虚拟 机 可 能 会 通过 一 些 


行 一 条 线程 中 的 指令 。 为 





因此 ， 


区 域 为 “线程 私有 ”的 内 存 。 


区 域 是 唯一 一 个 在 Java 





栈 (Java Virtual Machine Stacks) 也 是 线程 私有 的 ， 它 的 生命 周期 与 线程 相同 。 虚 拟 机 栈 描述 的 是 Java 方 法 执行 的 内 存 模型 : 每 个 方法 被 执行 的 时 候 都 会 同时 创建 一 
口 等 信息 。 每 一 个 方法 被 调用 直至 执行 完成 的 过 程 ， 就 对 应 着 一 个 栈 帧 在 虚拟 机 栈 中 从 入 栈 到 出 栈 的 过 程 。 


区 分 为 堆 内 存 (Heap) 和 栈 内 存 (Stack) ， 这 种 分 法 比较 粗糙 ，Java 内 存 区 域 的 划分 实际 上 远 比 这 复杂 。 这 种 划分 方式 的 流行 只 能 说 明 大 多 数 程序 员 最 关注 的 、 与 对 象 内 存 分 配 
会 专门 讲述 ， 而 所 指 的 “ 栈 ”就 是 现在 讲 的 





对 象 本 身 ， 根 据 不 同 的 虚拟 机 实现 ， 它 可 


句柄 或 者 其 他 与 此 对 象 相关 的 位 置 ) 和 returnAddress 类 型 (指向 了 一 条 字 节 码 指令 的 地 址 ) 。 















































在 Java 虚 拟 机 规范 中 ， 对 这 个 
可 动态 扩展 ， 只 不 过 Java 虚 拟 机 规范 中 也 允许 固 








定 长 度 的 虚拟 机 栈 ) 


2.2.3 ”本 地 方法 栈 














展 时 无 法 





， 当 扩 











本 地 方法 栈 (Native Method Stacks) 与 虚拟 机 栈 所 发 挥 的 作 上 


























服务 。 虚 拟 机 规范 中 对 本 地 方法 栈 中 的 方法 使 用 的 语言 、 使 
拟 机 栈 合 二 为 一 。 与 虚拟 机 栈 一 样 ， 本 地 方法 栈 
































2.2.4 _ Java 堆 








对 于 大 多 数 应 
几乎 所 有 的 对 象 实 俱 














方式 与 数据 结构 并 没有 强制 规定 ， 
区 域 也 会 抛 出 StackOverflowError 和 OutOfMemoryError 异 常 。 








来 说 ，Java 堆 (Java Heap) 是 java 虚拟 机 所 管理 的 内 存 中 最 大 的 一 块 。Java 堆 是 被 所 有 线程 共享 | 
都 在 这 里 分 配 内 存 。 这 一 点 在 Java 虚 拟 机 规范 中 的 描述 是 : 所 有 的 对 象 实例 以 及 数组 都 要 在 堆 上 分 配 思 ， 但 是 随 着 JIT 编 译 器 的 发 


换 BI 优 化 技术 将 会 导致 一 些微 妙 的 变化 发 生 ， 所 有 的 对 象 都 分 配 在 堆 上 也 渐渐 变 得 不 是 那么 “绝对 ”了 。 








Java 堆 是 垃圾 收集 器 管理 的 主要 





此 很 多 时 候 也 被 称 做 “ 





区 域 ， 





代 收 集 算法 ， 所 以 Java 堆 中 还 可 以 细 分 为 : 新 生 代 和 老年 代 ; 再 细致 一 点 的 有 Eden 空 间 、 
TLAB) 。 不 过 ， 无 论 如 何 划分 ， 都 与 存放 内 容 无 关 ， 无 论 哪个 
进行 讨论 ，Java 堆 中 的 上 述 各 个 区 域 的 分 配 和 回收 等 








有 的 分 配 缓冲 
也 分 配 内 存 。 在 本 章 中 ， 我 们 仅仅 针对 内 存 





区 (Thread Local Allocation Buffer， 


区 域 的 作 




















根据 Java 虚 拟 机 规范 的 
主流 的 虚拟 机 都 是 按照 可 扩 














2.2.5 方法 区 





GC 堆 ” (Garbage Collected Heap,， 幸好 | 





国 














因此 具体 的 虚拟 机 可 以 








区 域 规定 了 两 种 异常 状况 : 如 果 线 程 请 求 的 栈 深度 大 于 虚拟 机 所 允许 的 深度 ， 将 抛 出 StackOverflowError 异 常 ;， 如果 虚拟 机 栈 可 以 动态 扩 
请 到 足够 的 内 存 时 会 抛 出 OutOfMemoryError 异 常 。 


是 非常 相似 的 ， 其 区 别 不 过 是 虚拟 机 栈 为 虚拟 机 执行 Java 方 法 (也 就 是 字 节 码 ) 服务 ， 而 本 地 方法 栈 则 是 为 虚拟 机 使 
自由 实现 它 。 甚 至 有 的 虚拟 机 ( 壁 如 Sun HotSpot 虚 拟 机 ) 直接 就 把 本 地 方法 栈 和 虚 


的 一 块 内 存 区 域 ， 在 虚拟 机 启动 时 创建 。 此 内 存 区 域 的 唯一 


1 个 。 局 部 变量 表 所 需 的 内 存 空间 在 编译 期 间 完 成 分 配 ， 当 进入 一 个 方法 时 ， 这 个 方法 需要 在 帧 中 分 





展 (当前 大 部 分 的 Java 虚 拟 机 都 








到 的 Native 方 法 












































的 就 是 存放 对 象 实例 ， 








展 与 逃逸 分 析 技术 的 逐渐 成 熟 ， 栈 上 分 配 、 标 量 蔡 














内 没 翻译 成 “垃圾 堆 ”) 。 如 果 从 内 存 回 





收 的 


现在 收集 器 基本 都 是 采用 的 分 











度 看 ， 由 






































方法 
堆 的 一 个 逻辑 部 分 ， 但 是 它 却 有 一 个 别名 叫做 Non-Heap ( 非 堆 ) ， 





对 于 习惯 在 HotSpot 虚 拟 机 上 开发 和 部 署 程序 的 开发 者 来 说 ， 很 多 人 愿意 把 方法 区 称 为 “永久 代 ”“ 








区 (Method Area) 与 Java 堆 一 样 ， 是 各 个 线程 共享 的 内 存 





目的 应 该 是 与 Java 堆 区 分 开 来 。 











GC 分 代 收 集 扩展 至 方法 





区 ,或 者 说 使 用 永久 代 来 实现 方法 





Java 虚 拟 机 规范 对 这 个 


区 而 已 。 对 于 
息 ,现在 也 有 放弃 永久 代 并 “搬家 ”至 Native Memory 来 实现 方法 区 的 


区 域 的 限制 非常 宽松 ， 除 了 和 Java 堆 一 样 不 需要 连续 的 


bd 











了 。 


堆 也 无 法 再 扩 


区 域 ， 它 用 于 存储 已 被 虚拟 机 加 载 的 类 信息 、 常 量 、 





From Survivor 空 间 、To Survivor 空 间 等 。 如 果 从 内 存 分 配 的 角度 看 ， 线 程 共享 的 
区 域 ， 存 储 的 都 仍然 是 对 象 实例 ， 进 一 步 划分 
节 将 会 是 下 一 章 的 主题 。 


规定 ，Java 堆 可 以 处 于 物理 上 不 连续 的 内 存 空间 中 ， 只 要 逻辑 上 是 连续 的 即 可 ， 就 像 我 们 的 磁盘 空间 一 样 。 在 实现 时 ， 既 可 以 实现 成 固 
展 来 实现 的 〈 通 过 -Xmx 和 -Xms 控 制 ) 。 如 果 在 堆 中 没有 内 存 完 成 实例 分 配 ， 并 








ava 堆 中 可 能 划分 出 多 个 线程 私 
目的 是 为 了 更 好 地 回收 内 存 ， 或 者 更 快 

















定 大 小 的 ， 也 可 以 是 可 扩展 的 ， 不 过 当前 


展 时 ， 将 会 地 出 OutOfMemoryError 异 常 。 








静态 变量 、 即 时 编译 器 编译 后 的 代码 等 数 








虽然 Java 虚 拟 机 规范 把 方法 


风 
蕊 
区 
迷 











凸 。 








(Permanent Generation) ， 本 质 上 两 者 并 不 等 价 ， 仅 仅 是 
他 虚拟 机 (如 BEA JRockit、IBM J9 等 ) 来 说 是 不 存在 永久 代 的 概念 的 。 即 使 是 HotSpot 虚 拟 机 本 身 ， 根 据 官方 发 布 的 路 线 | 











因 团队 选 








为 HotSpot 虚 拟 机 的 设计 | 























冬 信 











内 存 和 可 以 选择 固 




















的 ， 但 并 非 数据 进入 了 方法 区 就 如 永久 代 的 名 字 一 样 “ 永 久 ”存在 了 


。 这 个 


区 域 的 





定 大 小 或 者 可 扩 
内 存 回 收 目标 主要 是 针对 常量 池 的 





回收 和 对 类 型 的 卸载 ， 一 般 来 说 这 个 

















型 的 卸载 ， 条 件 相当 苛刻 ， 但 是 这 部 分 





区 








根据 Java 虚 拟 机 规范 的 规定 ， 当 方法 区 无 法 满足 内 存 分 配 需求 时 
2.2.6 ”运行 时 常量 池 


运行 时 常量 池 (Runtime Constant Pool) 是 方法 区 的 一 部 分 。 











域 的 回收 确实 是 有 必要 的 。 在 Sun 公 司 的 BUG 列 表 中 ， 曾 出 现 过 的 若干 个 严重 的 BUG 就 是 


， 将 抛 出 OutOfMemoryError 异 常 。 


Class 文 件 中 除了 有 类 的 版 本 、 字 段 、 方 法 、 接 











生成 的 各 种 字面 量 和 符号 引用 ， 这 部 分 内 容 将 在 类 加 载 后 存放 到 方法 





























区 的 运行 时 常量 池 中 。 














Java 庶 拟 机 对 Class 文 件 的 每 一 部 分 ( 











然 也 包括 常量 池 ) 的 格式 都 有 严格 的 规定 ， 每 一 个 字 节 























池 ，Java 虚 拟 机 规范 没有 做 任何 细节 的 要 求 ， 不 同 的 提供 商 实现 的 虚拟 机 可 以 按照 


也 存储 在 运行 时 常量 池 中 内 。 

















运行 时 常量 池 相 对 于 Class 文 件 常量 池 的 另外 一 个 重要 特征 是 











口 等 描述 等 信息 外 ， 还 有 一 项 信息 是 








自己 的 需要 来 实现 这 个 内 存 




















运行 期 间 也 可 能 将 新 的 常量 放 入 池 中 ， 这 种 特性 被 开发 人 员 利 





M=I 
和 体 





展 外 ， 还 可 以 选择 不 实现 垃圾 收集 。 相 对 而 言 ， 垃 圾 收集 行为 在 这 个 
区 域 的 回收 “成 绩 ” 
由 于 低 版 本 的 HotSpot 虚 拟 机 对 此 


常量 池 (Constant Pool Table) ， 上 


于 存储 哪 种 数据 都 必须 符合 规范 上 的 要 求 ， 这 样 才 会 被 虚拟 机 认可 、 装 载 和 执行 。 但 对 于 运行 时 


区 域 是 比较 少 出 现 
比较 难以 令 人 满意 ， 尤 其 是 类 
可 收 而 导致 内 存 泄漏 。 

















区 域 未 完 














于 存放 编译 期 














常量 











区 域 。 不 过 ， 一 般 来 说 ， 除 了 保存 Class 文 件 中 描述 的 符号 引 


























外 ， 还 会 把 翻译 出 来 的 直接 引 




















备 动态 性 ，Java 语 言 并 不 要 求 常量 一 定 只 能 在 编译 期 产生 ， 也 就 是 并 非 预 置 入 Class 文 件 中 常量 池 的 内 容 才 能 进入 方法 区 
比较 多 的 便 是 String 类 的 intern() 方 法 。 














既然 运行 时 常量 池 是 方法 区 的 一 部 分 ， 自 然 会 受到 方法 区 内 存 的 限制 ， 当 常量 池 无 法 再 申请 到 内 存 时 会 抛 出 OutOfMemoryError 异 常 。 











2.2.7 ”直接 内 存 








直接 内 存 (Direct Memory) 并 不 是 虚拟 机 运行 时 数据 区 的 一 部 分 ， 也 不 是 Java 虚 拟 机 规范 中 定义 的 内 存 区 域 ， 但 是 这 部 分 内 存 也 被 频繁 地 使 用 ， 而 且 也 可 能 导致 QutOfMemoryError 异 常 出 现 ， 所 以 
我 们 放 到 这 里 一 起 讲解 。 

















在 JDK 1.4 中 新 加 入 了 NIO (New Input/Output) 类 ， 引 入 了 一 种 基于 通道 (Channel) 与 缓冲 区 (Buffer) 的 MO 方式 ， 它 可 以 使 用 Native 函 数 库 直 接 分 配 堆 外 内 存 ， 然 后 通过 一 个 存储 在 Java 堆 里 
面 的 DirectByteBuffer 对 象 作为 这 块 内 存 的 引用 进行 操作 。 这 样 能 在 一 些 场景 中 显著 提高 性 能 ， 因 为 避免 了 在 Java 堆 和 Native 堆 中 来 回复 制 数据 。 


















































显然 ， 本 机 直接 内 存 的 分 配 不 会 受到 Java 堆 大 小 的 限制 ， 但 是 ， 既 然 是 内 存 ， 则 肯定 还 是 会 受到 本 机 总 内 存 (包括 RAM 及 SWAP 区 或 者 分 页 文件 ) 的 大 小 及 处 理 器 寻 址 空间 的 限制 。 服 务 器 管理 员 配置 
虚拟 机 参数 时 ， 一 般 会 根据 实际 内 存 设置 -Xmx 等 参数 信息 ， 但 经 常会 忽略 掉 直接 内 存 ， 使 得 各 个 内 存 区 域 的 总 和 大 于 物理 内 存 限制 (包括 物理 上 的 和 操作 系统 级 的 限制 ) ， 从 而 导致 动态 扩展 时 出 现 
OutOfMemoryError 异 常 。 
































外 栈 帧 是 方法 运行 期 的 基础 数据 结构 ， 在 本 书 的 第 8 章 中 会 对 帧 进行 详细 讲解 。 

思 ] Java 庶 拟 机 规范 中 的 原文 : The heap is the runtime data area from which memory for all class instances and arrays is allocated。 
[3] 逃逸 分 析 与 标量 替换 的 相关 内 容 ， 请 参见 第 11 章 的 相关 内 容 

图 关于 Class 文 件 格式 和 符号 引用 等 概念 可 参见 第 6 章 。 


2.3 ”对象 访问 


介绍 完 Java 虚 拟 机 的 运行 时 数据 区 之 后 ， 我 们 就 可 以 来 探讨 一 个 问题 : 在 Java 语 言 中 ， 对 象 访问 是 如 何 进行 的 ”对 象 访问 在 Java 语 言 中 无 处 不 在 ， 是 最 普通 的 程序 行为 ， 但 即使 是 最 简单 的 访问 ， 也 会 
却 涉及 Java 栈 、Java 堆 、 方 法 区 这 三 个 最 重要 内 存 区 域 之 间 的 关联 关系 ， 如 下 面 的 这 名 代码: 









































Object obj = new Object () 7 





假设 这 名 代码 出 现在 方法 体 中 ,， 那 “Object obj” 这 部 分 的 语义 将 会 反映 到 Java 栈 的 本 地 变量 表 中 ， 作 为 一 个 reference 类 型 数据 出 现 。 而 “new Object0” 这 部 分 的 语义 将 会 反映 到 Java 扒 中 ， 形 成 一 
块 存储 了 Object 类 型 所 有 实例 数据 值 (Instance Data， 对 象 中 各 个 实例 字段 的 数据 ) 的 结构 化 内 存 ， 根 据 具 体 类 型 以 及 虚拟 机 实现 的 对 象 内 存 布局 (Object Memory Layout) 的 不 同 ， 这 块 内 存 的 长 度 是 
不 固定 的 。 另 外 ， 在 Java 堆 中 还 必须 包含 能 查找 到 此 对 象 类 型 数据 (如 对 象 类 型 、 父 类 、 实 现 的 接口 、 方 法 等 ) 的 地 址 信息 ， 这 些 类 型 数据 则 存储 在 方法 区 中 。 
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由 于 reference 类 型 在 Java 虚 拟 机 规范 里 面 只 规定 了 一 个 指向 对 象 的 引用 ， 并 没有 定义 这 个 引用 应 该 通过 哪 种 方式 去 定位 ， 以 及 访问 到 Java 推 中 的 对 象 的 具体 位 置 ， 因 此 不 同 虚 拟 机 实现 的 对 象 访问 方式 
会 有 所 不 同 ， 主 流 的 访问 方式 有 两 种 : 使 用 句柄 和 直接 指针 。 




















: 如 果 使 用 句柄 访问 方式 ，Java 推 中 将 会 划分 出 一 块 内 存 来 作为 句柄 池 ，teference 中 存储 的 就 是 对 象 的 句柄 地 址 ， 而 句柄 中 包含 了 对 象 实例 数据 和 类 型 数据 各 自 的 具体 地 址 信息 ， 如 图 2-2 所 示 。 


Java 栈 和 A nl: 


) 一 ~ 
| 妾 类 型 泊 所 的 和 RN 


对 囚 尖 型 数据 





图 2-2 ”通过 句柄 访问 对 象 














“ 如 果 使 用 直接 指针 访问 方式 ，Java 堆 对 象 的 布局 中 就 必须 考虑 如 何 放置 访问 类 型 数据 的 相关 信息 ，reference 中 直接 存储 的 就 是 对 象 地 址 ， 如 图 2-3 所 示 。 


Java 棱 
本 地 变量 表 


reference 


到 | 对象 类 型 数据 的 指针 


对 办 实例 数据 


对 稍 尖 型 数据 





图 2-3 通过 直接 指针 访问 对 象 








这 两 种 对 象 的 访问 方式 各 有 优势 ， 使 用 句柄 访问 方式 的 最 大 好 处 就 是 reference 中 存储 的 是 稳定 的 句柄 地 址 ， 在 对 象 被 移动 (垃圾 收集 时 移动 对 象 是 非常 普遍 的 行为 ) 时 只 会 改变 句柄 中 的 实例 数据 指 
针 ， 而 reference 本 身 不 需要 被 修改 。 























使 用 直接 指针 访问 方式 的 最 大 好 处 就 是 速度 更 快 ， 它 节省 了 一 次 指针 定位 的 时 间 开 销 ， 由 于 对 象 的 访问 在 Java 中 非常 频繁 ， 因 此 这 类 开销 积 少 成 多 后 也 是 一 项 非常 可 观 的 执行 成 本 。 就 本 书 讨论 的 主要 
虚拟 机 Sun HotSpot 而 言 ， 它 是 使 用 第 二 种 方式 进行 对 象 访 问 的， 但 从 整个 软件 开发 的 范围 来 看 ， 各 种 语言 和 框架 使 用 句柄 来 访问 的 情况 也 十 分 常见 



























































2.4 实战 : OutOfMemoryError 异 常 





在 Java 虚 拟 机 规范 的 描述 中 ， 除 了 程序 计数 器 外 ， 虚 拟 机 内 存 的 其 他 几 个 运行 时 区 域 都 有 发 生 OutOfMemoryError (下 文 称 OOM) 异常 的 可 能 ， 本 节 将 通过 若干 实例 来 验证 异常 发 生 的 场景 (代码 清 
2-1 至 代码 清单 2-6 的 几 段 简单 代码 ) ， 并 且 会 初步 介绍 几 个 与 内 存 相 关 的 最 基本 的 虚拟 机 参数 。 
































本 节 内 容 的 目的 有 两 个 : 第 一 ， 通 过 代码 验证 Java 虚 拟 机 规范 中 描述 的 各 个 运行 时 区 域 储存 的 内 容 ; 第 二 ， 希 望 读者 在 工作 中 遇 到 实际 的 内 存 溢出 异常 时 ， 能 根据 异常 的 信息 快速 判断 是 哪个 区 域 的 内 
存 溢出 ， 知 道 怎样 的 代码 可 能 会 导致 这 些 区 域 的 内 存 溢出 ， 以 及 出 现 这 些 异常 后 该 如 何 处 理 。 

















下 面 代码 的 开头 都 注释 了 执行 时 所 需要 设置 的 虚拟 机 启动 参数 (注释 中 “VM Args” 后 面 跟着 的 参数 ) ， 这 些 参数 对 实验 的 结果 有 直接 影响 ， 请 读者 调试 代码 的 时 候 不 要 忽略 掉 。 如 果 读 者 使 用 控制 台 
命令 来 执行 程序 ， 那 直接 跟 在 Java 命 令 之 后 书写 就 可 以 。 如 果 读者 使 用 Eclipse IDE， 则 可 以 参考 图 2-4 在 Debug/Run 页 签 中 的 设置 。 















































下 文 的 代码 都 是 基于 Sun HotSpot 17.1-b03 (JDK 1.6Update 22 中 带 的 虚拟 机 ) 运行 的 ， 对 于 不 同 公司 的 不 同 版 本 的 虚拟 机 ， 参 数 和 程序 运行 的 结果 可 能 会 有 所 差别 。 


2.4.1 Java 扒 溢出 








Java 堆 用 于 储存 对 象 实例 ， 我 们 只 要 不 断 地 创建 对 象 ， 并 且 保证 GC Roots 到 对 象 之 间 有 可 达 路 径 来 避免 垃圾 回收 机 制 清除 这 些 对 象 ， 就 会 在 对 象 数量 到 达 最 大 堆 的 容量 限制 后 产生 内 存 溢出 异常。 























代码 清单 2-1 中 限制 Java 堆 的 大 小 为 20MB， 不 可 扩展 (将 堆 的 最 小 值 -Xms 参 数 与 最 大 值 -Xmx 参 数 设置 为 一 样 即 可 避免 堆 自动 扩展 ) ， 通 过 参数 -XX: +HeapDump OnOutOfMemoryError 可 以 让 虚 
拟 机 在 出 现 内 存 溢出 异常 时 Dump 出 当前 的 内 存 堆 转 储 快照 以 便 事后 进行 分 析 [。 
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图 2-4 在 Eclipse 的 Debug 页 签 中 设置 虚拟 机 参数 


代码 清单 2-1 Java 扒 内 存 溢出 异常 测试 





/* 
* VM Args: -Xms20m -Xmx20m -XX:+HeapDumpOnOutOfMemoryError 
* @author zzm 
*/ 

public class HeapOOM { 

static class OOMObject { 

} 

public static void main(String[] args) { 
List<OOMObJject> list = new ArrayList<OOMObject>(); 
while (true) { 

list.add (new OOMObject ()); 








java.lang.OutOfMemoryError: Java heap space 
Dumping heap to java pid3404.hprof http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 


Heap dump file created [22045981 bytes in 0.663 secs] 





Java 堆 内 存 的 OOM 异 常 是 实际 应 用 中 最 常见 的 内 存 溢出 异常 情况 。 出 现 Java 堆 内 存 溢出 时 ， 异 常 堆栈 信息 “java.lang.OutOfMemoryError” 会 跟着 进一步 提示 “Java heap space”。 


要 解决 这 个 区 域 的 异常 ， 一 般 的 手段 是 首先 通过 内 存 映像 分 析 工 具 (如 Eclipse Memory Analyzer) 对 dump 出 来 的 堆 转 储 快照 进行 分 析 ， 重 点 是 确认 内 存 中 的 对 象 是 否 是 必要 的 ， 也 就 是 要 先 分 清楚 
到 底 是 出 现 了 内 存 泄漏 (Memory Leak) 还 是 内 存 溢 出 (Memory Overflow) 。 图 2-5 显 示 了 使 用 Eclipse Memory Analyzer 打 开 的 堆 转 储 快 照 文件 。 





如 果 是 内 存 泄漏 ， 可 进一步 通过 工具 查看 泄漏 对 象 到 GC Roots 的 引用 链 。 于 是 就 能 找到 泄漏 对 象 是 通过 怎样 的 路 径 与 GC Roots 相 关联 并 导致 垃圾 收集 器 无 法 自动 回收 它们 的 。 掌 握 了 泄漏 对 象 的 类 型 
信息 ， 以 及 GC Roots 引 用 链 的 信息 ， 就 可 以 比较 准确 地 定位 出 泄漏 代码 的 位 置 。 

如 果 不 存在 泄漏 ， 换 句 话说 就 是 内 存 中 的 对 象 确实 都 还 必须 存活 着 ， 那 就 应 当 检查 虚拟 机 的 堆 参 数 (-Xmx 与 -Xms) ， 与 机 器 物理 内 存 对 比 看 是 否 还 可 以 调 大 ， 从 代码 上 检查 是 否 存在 某 些 对 象 生 命 周 
期 过 长 、 持 有 状态 时 间 过 长 的 情况 ， 尝 试 减少 程序 运行 期 的 内 存 消耗 。 


以 上 是 处 理 Java 堆 内 存 问题 的 简略 思路 ， 处 理 这些 问 题 所 需要 的 知识 、 工 具 与 经 验 是 后 面 三 章 的 主题 。 


2.4.2 ”虚拟 机 栈 和 本 地 方法 栈 溢 出 
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图 2-5 ”使 用 Eclipse Memory Analyzer 打 开 的 堆 转 储 快照 文件 


由 于 在 Hotspot 虚 拟 机 中 并 不 区 分 虚拟 机 栈 和 本 地 方法 栈 ， 因 此 对 于 HotSpot 来 说 ，-Xoss 参 数 (设置 本 地 方法 栈 大 小 ) 虽然 存在 ， 但 实际 上 是 无 效 的 ， 栈 容量 只 由 -Xss 参 数 设 定 。 关 于 虚拟 机 栈 和 本 地 
方法 栈 ， 在 Java 虚 拟 机 规范 中 描述 了 两 种 异常 : 








“ 如 果 线 程 请 求 的 栈 深 度 大 于 虚拟 机 所 允许 的 最 大 深度 ， 将 抛 出 StackOverflowError 异 常 。 


“ 如 果 虚 拟 机 在 扩展 栈 时 无 法 申请 到 足够 的 内 存 空 间 ， 则 抛 出 OutOfMemoryError 异 常 。 


这 里 把 异常 分 成 两 种 情况 看 似 更 加 严谨 ， 但 却 存 在 着 一 些 互相 重 苹 的 地 方 : 当 栈 空间 无 法 继续 分 配 时 ， 到 | 底 是 内 存 太 小 ， 还 是 已 使 用 的 栈 空 间 太 大 ， 其 本 质 上 只 是 对 同一 件 事情 的 两 种 描述 而 已 。 





在 笔者 的 实验 中 ， 如 果 将 实验 范围 限制 于 单线 程 中 的 操作 ， 尝 试 了 下 面 两 种 方法 均 无 法 让 虚拟 机 产生 OutOfMemoryError 异 常 ， 尝 试 的 结果 都 是 获得 StackOverflowError 异 常 ， 测 试 代码 如 清单 2-2 所 


“ 使 用 -Xss 参 数 减少 栈 内 存 容 量 。 结 果 : 抛 出 StackOverflowError 异 常 ， 异 常 出 现时 输出 的 栈 深度 相应 缩小 。 


“ 定义 了 大 量 的 本 地 变量 ， 增 加 此 方法 帧 中 本 地 变量 表 的 长 度 。 结 果 : 抛 出 StackOverflowEttror 异 常 时 输出 的 栈 深度 相应 缩小 。 


代码 清单 2-2 ”虚拟 机 栈 和 本 地 方法 栈 OOM 测 试 〈 仅 作为 第 1 点 测试 程序 ) 





/** 
和 
x 
eA 

pub. 


VM Args: -Xss128k 
@author zzm 


lic class JavaVMStackSOF { 


Private int stackLength = 1; 


public void stackLeak() { 
StackLength+ 十 7 
stackLeak (); 

} 


public static void main (String[] args) throws Throwable { 
JavaVMStackSOF oom = new JavaVMStackSoOrF (); 


try { 
oom.stackLeak (); 
} catch (Throwable e) { 


System.out .Println("stack length:" + oom.stackLength); 


throw e; 








sta 


ck length:2402 


Exception in thread "main" java.lang.StackOverflowError 

at org.fenixsoft .oom.VMStackSOF. leak (VMStackSOF.java:20) 
at org.fenixsoft .oom.VMStackSOF.leak (VMStackSOF .java:21) 
at org.fenixsoft.oom.VMStackSOF .leak (VMStackSOF .java:21) 


.后 续 异 常 栈 信息 省 略 





实验 结果 表明 : 在 单个 线程 下 ， 无 论 是 由 于 栈 帧 太 大 ， 还 是 虚拟 机 栈 容量 太 小 ， 当 内 存 无 法 分 配 的 时 候 ， 虚 拟 机 抛 出 的 都 是 StackOverflowError 异 常 。 








如 果 测试 时 不 限于 单线 程 ， 通 过 不 断 地 建立 线程 的 方式 倒是 可 以 产生 内 存 溢出 异常 ， 如 代码 清 


种 情况 下 ， 给 每 个 线程 的 栈 分 配 的 内 存 越 大 ， 反 而 越 容易 产生 内 存 溢出 异常 。 


限制 ) 减 去 Xmx (最 大 堆 容量 ) ， 


栈 









































单 2-3 所 示 。 但 是 ， 这 样 产生 的 内 存 溢出 异常 与 栈 空间 是 否 足够 大 并 不 存在 任何 联系 ， 或 者 准确 地 说 ， 在 这 


原因 其 实 不 难 理解 ， 操 作 系统 分 配给 每 个 进程 的 内 存 是 有 限制 的 ， 艾 如 32 位 的 Windows 限 制 为 2GB。 虚 拟 机 提供 了 参数 来 控制 Java 堆 和 方法 区 的 这 两 部 分 内 存 的 最 大 值 。 剩 余 的 内 存 为 2GB (操作 系统 
再 减 去 MaxPermsize (最 大 方法 区 容量 ) ， 程 序 计 数 器 消耗 内 存 很 小 ， 可 以 忽略 掉 。 如 果 虚 拟 机 进程 本 身 耗 费 的 内 存 不 计算 在 内 ， 剩 下 的 内 存 就 由 虚拟 机 栈 和 本 地 方法 
“瓜分 ”了 。 每 个 线程 分 配 到 的 栈 容量 越 大 ， 可 以 建立 的 线程 数量 自然 就 越 少 ， 建 立 线程 时 就 越 容易 把 剩 下 的 内 存 耗 尽 。 


























这 一 点 读者 需要 在 开发 多 线程 应 用 的 时 候 特别 注意 ， 出 现 StackOverflowError 异 常 时 有 错误 堆栈 可 以 阅读 ， 相 对 来 说 ， 比 较 容易 找到 问题 的 所 在 。 而 且 ， 如 果 使 用 虚拟 机 默认 参数 ， 栈 深度 在 大 多 数 情 
况 下 (因为 每 个 方法 压 入 栈 的 帧 大 小 并 不 是 一 样 的 ， 所 以 只 能 说 大 多 数 情况 下 ) 达到 1000~2000 完 全 没有 问题 ， 
导致 的 内 存 溢出 ， 在 不 能 减少 线程 数 或 者 更 换 64 位 虚拟 机 的 情况 下 ， 就 只 能 通过 减少 最 大 堆 和 减少 栈 容量 来 换取 更 多 的 线程 。 如 果 没有 这 方面 的 经 验 ， 这 种 通过 “减少 内 存 ” 的 手段 来 解决 内 存 溢出 的 方式 
会 比较 难以 想到 。 























代码 清单 2-3 ”创建 线程 导致 内 存 溢出 异常 





/** 
* VM Args: -Xss2M 
* @author zzm 
wd 
public class JavaVMStackOOM { 
Private void dontStop() { 
while (true) { 
} 
} 
public void stackLeakByThread() { 
while (true) { 
Thread thread = new Thread(new Runnable() { 
QOverride 
public void run() { 
dontstop (); 
} 
]) 7 
thread. start (); 
} 


} 

public static void main(String[] args) throws Throwable { 
JavaVMStackOOM oom = new JavaVMStackOoM(); 
oom.stackLeakByThread (); 

} 


对 于 正常 的 方法 调 





























(包括 递 腿 ) ， 这 个 深度 应 该 完全 够 用 了 。 但 是 ， 如 果 是 建立 过 多 线程 





























注意 ”特别 提示 一 下 ， 如 果 读者 要 尝试 运行 上 面 这 段 代码 ， 记 得 要 先 保 存 当前 的 工作 ， 由 于 在 Windows 平 台 的 虚拟 机 中 ，Java 的 线程 是 映射 到 操作 系统 的 内 核 线程 上 的 站， 所 以 上 述 代码 执行 时 有 较 大 的 


风险 ， 可 能 会 导致 操作 系统 假死 。 





Exception in thread "main" java.lang.OutOfMemoryError: unable to create new native thread 


2.4.3 ”运行 时 常量 池 溢 出 


对 象 ; 否则 ， 将 此 String 对象 包 含 的 字符 串 添 加 到 常量 池 中 ， 并 且 返 











如 果 要 向 运行 时 常量 池 中 添加 内 容 ， 最 简单 的 做 法 就 是 使 用 String.intern(0 这 个 Native 方 法 。 
































该 方法 的 作 












































回 





此 String 对 象 的 引用 。 由 了 




















接 限制 其 中 常量 池 的 容量 ， 如 代码 清单 2-4 所 示 。 














代码 清单 2-4， 运行 时 常量 池 导 致 的 内 存 溢出 异常 





[六 
* VM Args: -XX:PermSize=10M -XX:MaxPermSize=10M 
* Qauthor zzm 
上 
Public class RuntimeConstantPoolOOM { 
public static void main (String[] args) { 
// 使 用 List 保 持 着 常量 池 引 用 ， 避 免 PFul1 GC 回收 常量 池 行 为 
List<String> list = new ArrayList<String>(); 
// 10MB 的 Permsize 在 integer 范 围 内 足够 产生 OOM 了 
int i = 0; 
while (true) { 
list.add (String.valueOf (i++) .intern()); 


Exception in thread "main" java.lang.OutOfMemoryError: PermGen space 
at java.lang.String.intern (Native Method) 
at org.fenixsoft.oom.RuntimeConstantPoolOOM.main (RuntimeConstantPoolOOM.java:18) 











是 : 如 果 池 中 已 经 包含 一 个 等 于 此 string 对 象 的 字符 串 ， 则 返回 代表 池 中 这 个 字符 串 的 String 


常量 池 分 配 在 方法 区 内 ， 我 们 可 以 通过 -XX: Permsize 和 -XX: MaxPermSize 限 制 方法 区 的 大 小 ， 从 而 间 

















从 运行 结果 中 可 以 看 到 ， 运 行 时 常量 池 溢出 ， 在 OutOfMemoryError 后 面 跟随 的 提示 信息 是 “PermGen space” ， 说 明 运行 时 常量 池 属于 方法 区 (HotSpot 庶 拟 机 中 的 永久 代 ) 的 一 部 分 。 





2.4.4 方法 区 溢出 


态 
态 














方法 区 用 于 存放 Class 的 相关 信息 ， 如 类 名 、 访 问 修饰 符 、 常 量 池 、 字 段 描述 、 方 法 描述 等 。 





























值得 特别 注意 的 是 ， 我 们 在 这 个 例子 中 模拟 的 场景 并 非 纯粹 是 一 个 实验 ， 这 样 的 应 用 经 常 





节 码 技术 ， 增 强 的 类 越 多 ， 就 需要 越 大 的 方法 区 来 保证 动态 生成 的 Class 可 以 加 载 入 内 存 。 





代码 清单 2-5 ”借助 CGLib 使 得 方法 区 出 现 内 存 溢出 异常 


















































对 于 这 个 区 域 的 测试 ， 基 本 的 思路 是 运行 时 产生 大 量 的 类 去 填 满 方法 区 ， 直 到 ) 溢 出。 虽然 直接 使 用 Java SE 
APl 也 可 以 动态 产生 类 (如 反射 时 的 GeneratedConstructorAccessor 和 动态 代理 等 ) ， 但 在 本 次 实验 中 操作 起 来 比较 麻烦 。 在 代码 清单 2-5 中 ， 笔 者 借助 CGLibB] 直 接 操作 字 节 码 运行 时 ， 生 成 了 大 量 的 动 
































出 现在 实际 应 








当前 的 很 多 














中 : 


流 框 架 ， 如 Spring 和 Hibernate 对 类 进行 增强 时 ， 都 会 使 用 到 CGLib 这 类 字 








/六 
* VM Args: -XX:PermSize=10M -XX:MaxPermSize=10M 
* Qauthor zzm 
Wd 
public class JavaMethodAreaOOM { 
public static void main (String[] args) { 
while (true) { 
Enhancer enhancer = new Enhancer(); 
enhancer. setSuperclass (OOMObject .class); 
enhancer .setUseCache (false); 
enhancer.setCallback (new MethodInterceptor() { 
public Object intercept (Object obj, Method method, Object[] args, MethodProxy proxy) throws Throwable { 
return proxy.invokeSuper (obj, args); 
} 
D); 


enhancer.create (); 


} 
static class OOMObJject { 
i 








Caused by: java.lang.OutOfMemoryError: PermGen space 

at java.lang.ClassLoader.defineClassl] (Native Method) 

at java.lang.ClassLoader.defineClassCond (ClassLoader .java:632) 

at java.lang.ClassLoader.defineClass (ClassLoader .java: 616) 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 8 more 






































方法 区 溢出 也 是 一 种 常见 的 内 存 溢出 异常 ， 一 个 类 如 果 要 被 垃圾 收集 器 回收 掉 ， 判 定 条 件 是 非常 苛刻 的 。 在 经 常 动态 生成 大 量 Class 的 应 用 中 ， 需 要 特别 注意 类 的 回收 状况 。 这 类 场景 除了 上 面 提 到 的 程 
序 使 用 了 GCLib 字 节 码 增强 外 ， 常 见 的 还 有 : 大 量 JSP 或 动态 产生 JSP 文 件 的 应 用 (JSP 第 一 次 运行 时 需要 编译 为 java 类) 、 基 于 OSGi 的 应 用 (即使 是 同一 个 类 文件 ， 被 不 同 的 加 载 器 加 载 也 会 视 为 不 同 的 
类 ) 等 。 




































































2.4.5 ”本 机 直接 内 存 溢出 


DirectMemory 容 量 可 通过 -XX: MaxDirectMemorySize 指 定 ， 如 果 不 指定 ， 则 默认 与 Java 堆 的 最 大 值 (-Xmx 指 定 ) 一 样 。 代 码 清单 2-6 越 过 了 DirectByteBuffer 类 ， 直 接 通 过 反射 获取 Unsafe 实 例 并 
进行 内 存 分 配 (Unsafe 类 的 getUnsafe() 方 法 限制 了 只 有 引导 类 加 载 器 才 会 返回 实例 ， 也 就 是 设计 者 希望 只 有 rtjar 中 的 类 才能 使 用 Unsafe 的 功能 ) 。 因 为 ， 虽 然 使 用 DirectByteBuffer 分 配 内 存 也 会 抛 出 内 


存 溢出 异常 ， 但 它 抛 出 异常 时 并 没有 真正 向 操作 系统 申请 分 配 内 存 ， 而 是 通过 计算 得 知 内 存 无 法 分 配 ， 于 是 手动 抛 出 异常 ， 真 正 申请 分 配 内 存 的 方法 是 unsafe.allocateMemory()。 


















































代码 清单 2-6 ”使 用 unsafe 分 配 本 机 内 存 





[六 

* VM Args: -Xmx20M -XX:MaxDirectMemorySize=10M 

* @author zzm 

< 
public class DirectMemoryOOM { 
private static final int 1MB = 1024 * 1024; 
public static void main(String[] args) throws Exception { 
Field unsafeField = Unsafe.class.getDeclaredFields () [0]; 
unsafeField.setAccessible (true); 

Unsafe unsafe = (Unsafe) unsafeField.get (null); 

while (true) { 

unsafe.allocateMemory (_1MB); 








Exception in thread "main" java.lang.OutOfMemoryError 
at sun.misc.Unsafe.allocateMemory (Native Method) 
at org.fenixsoft .oom.DMOOM.main (DMOOM.java:20) 





[中 关于 堆 转 储 快照 文件 分 析 方 面 的 内 容 ， 可 参见 第 4 章 。 
[中 关于 虚拟 机 线程 实现 方面 的 内 容 可 以 参考 本 书 第 12 章 。 
[3] CGLib 开 源 项 目 : http://cglib.sourceforge.net/ 。 


2.5 本章 小 结 


通过 本 章 的 学 习 ， 我 们 明白 了 虚拟 机 里 面 的 内 存 是 如 何 划分 的 ， 哪 部 分 区 域 、 什 么 样 的 代码 和 操作 可 能 导致 内 存 溢 出 异常 。 虽 然 Java 有 垃圾 收集 机 制 ， 但 内 存 溢 出 异常 离 我 们 并 不 遥远 ， 本 章 只 是 讲解 
了 各 个 区 域 出 现 内 存 溢出 异常 的 原因 ， 下 一 章 将 详细 讲解 java 垃圾 收集 机 制 为 了 避免 内 存 溢出 异常 的 出 现 都 做 了 哪些 努力 。 

















第 3 章 ”垃圾 收集 器 与 内 存 分 配 策略 


本 章 主要 内 容 

“ 概述 
“对象 已 死 ? 

“ 垃圾 收集 算法 
“ 垃圾 收集 器 


: 内存 分 配 与 回收 策略 











Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 的 高 墙 ， 墙 外 面 的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 
































3.1 ”概述 


说 起 垃圾 收集 (Garbage Collection，GC) ， 大 部 分 人 都 把 这 项 技术 当做 Java 语 言 的 伴生 产物 。 


收集 技术 的 语言 。 当 Lisp 还 在 胚胎 时 期 时 ， 人 们 就 在 思考 GC 需要 完成 的 三 件 事情 : 
- 哪些 内 存 需要 回收 ? 
. 什么 时 候 回收 ? 


“ 如 何 回收 ? 





经 过 


局 问题 时 ， 当 垃圾 收集 成 为 系统 达到 更 高 并 发 量 的 瓶颈 时 ， 我 们 就 需要 对 这 些 





泄 ) 





把 时 间 从 
随 着 方法 的 进入 和 退出 而 有 条 不 率 地 执行 着 出 栈 和 入 栈 操作 。 每 一 个 栈 
中 ， 大 体 上 可 以 认为 是 编译 期 可 知 的 ) ， 因 此 这 几 个 区 域 的 内 存 分 配 和 
和 方法 区 则 不 一 样 ， 一 个 接口 中 的 多 个 实现 类 需要 的 









































个 世纪 的 发 展 ， 内 存 的 动态 分 配 与 内 存 回收 技术 已 经 相当 成 熟 ， 一 切 看 起 来 都 进入 了 “自动 化 ”时 代 ， 那 为 什么 我 们 还 要 去 了 解 GC 和 内 存 分 配 呢 ? 答案 很 简 自 
“自动 化 ”的 技术 实施 必要 的 监控 和 调节 。 


个 世纪 以 前 拨 回 到 现在 ， 回 到 我 们 熟悉 的 Java 语 言 。 第 2 章 介绍 了 Java 内 存 运 行 时 
项 中 分 配 多 少 内 存 基本 上 是 在 类 结构 确定 下 来 时 就 已 知 的 (尽管 在 运行 期 会 由 川 编译 器 进行 一 些 优化 ， 但 在 本 章 基 于 概念 模型 的 讨论 
回收 都 具备 确定 性 ， 在 这 几 个 
内 存 可 能 不 一 样 ， 一 个 方法 中 的 多 个 分 支 需要 的 

















内 存 动态 分 配 和 垃圾 











诞生 于 MIT 的 Lisp 是 第 一 门 真正 使 





实 上 ，GC 的 历史 远 远 比 Java 久 远 ，1960， 

















和 a: 当 需 要 排查 各 种 内 存 溢出 、 内 存 








区 域 随 线程 而 生 ， 随 线程 而 灭 ， 栈 中 的 栈 帧 





区 域 的 各 个 部 分 ， 其 中 程序 计数 器 、 虚 拟 机 栈 、 本 地 方法 栈 三 个 























区 域内 不 需要 过 多 考虑 回收 的 问题 ， 因 为 方法 结束 或 线程 结束 时 ， 内 存 自 然 就 跟随 着 回收 了 。 而 Java 堆 
内 存 也 可 能 不 一 样 ， 我 们 只 有 在 程序 处 于 运行 期 间 时 才能 知道 会 创建 哪些 对 象 ， 这 部 分 内 存 的 分 配 和 回 











收 都 是 动态 的 ， 垃 圾 收集 器 所 关注 的 是 这 部 分 内 存 ， 本 书后 续 讨 论 中 的 “内 存 ” 分 配 与 回收 也 仅 指 这 一 部 分 内 存 。 

































































































































































































































































































































































3.2 “对象 已 死 ? 

堆 中 几乎 存放 着 java 世界 中 所 有 的 对 象 实例 ， 垃 圾 收集 器 在 对 堆 进行 回收 前 ， 第 一 件 事情 就 是 要 确定 这 些 对 象 有 哪些 还 “人 存活” 着， 哪些 已 经 “死去 ” ( 即 不 可 能 再 被 任何 途径 使 用 的 对 象 ) 。 
3.2.1 引用 计数 算法 

很 多 教科 书 判断 对 象 是 否 存 活 的 算法 是 这 样 的 : 给 对 象 中 添加 一 个 引用 计数 器 ， 每 当 有 一 个 地 方 引用 它 时 ， 计 数 器 值 就 加 1; 当 引 用 失效 时 ， 计 数 器 值 就 减 1;， 任 何 时 刻 计数 器 都 为 0 的 对 象 就 是 不 可 能 
再 被 使 用 的 。 笔 者 面试 过 很 多 的 应 届 生 和 一 些 有 多 年 工作 经 验 的 开发 人 员 ， 他 们 对 于 这 个 问题 给 予 的 都 是 这 个 答案 。 

客观 地 说 ， 引 用 计数 算法 (Reference Counting) 的 实现 简单 ， 判 定 效率 也 很 高 ， 在 大 部 分 情况 下 它 都 是 一 个 不 错 的 算法 ， 也 有 一 些 比较 著名 的 应 用 案例 ， 例 如 微软 的 COM (Component Object 
Model) 技术 、 使 用 ActionScript 3 的 FlashPlayer、Python 语 言 以 及 在 游戏 脚本 领域 中 被 广泛 应 用 的 Squirrel 中 都 使 用 了 引用 计数 算法 进行 内 存 管理 。 但 是 ，Java 语 言 中 没有 选用 引用 计数 算法 来 管理 内 
存 ， 其 中 最 主要 的 原因 是 它 很 难 解决 对 象 之 间 的 相互 循环 引用 的 问题 。 

举 个 简单 的 例子 ， 请 看 代码 清单 3-1 中 的 testGC() 方 法 : 对 象 objA 和 objB 都 有 字段 instance， 赋 值 令 objA.instance=objB 及 objB.instance=objA， 除 此 之 外 ， 这 两 个 对 象 再 无 任何 引用 ， 实 际 上 这 两 个 
对 象 已 经 不 可 能 再 被 访问 ， 但 是 它们 因为 互相 引用 着 对 方 ， 导 致 它们 的 引用 计数 都 不 为 0%0， 于 是 引用 计数 算法 无 法 通知 GC 收集 器 回收 它们 。 

代码 清单 3-1 引用 计数 算法 的 缺陷 

/** 


* testGC() 方 法 执行 后 ，objA 和 objB 会 不 会 被 GC 呢 ? 
* @author zzm 
wed 
public class ReferenceCountingGC { 
public Object instance = null; 
Private static final int 1MB = 1024 * 1024; 


* 这 个 成 员 属性 的 唯一 意义 就 是 占 点 内 存 ， 以 便 能 在 GC 日 志 中 看 清楚 是 否 被 回收 过 
wp 


private byte[] bigSize = new byte[2 * 
public static void testGC () 
ReferenceCountingGC objA = new ReferenceCountingGC ( 
ReferenceCountingGC objB = new ReferenceCountingGC( 
ObjA.instance = objB; 
ObjB.instance = objA; 
objA = null; 


_1MB]; 
{ 


); 
); 





生 GC， 那 么 objA 和 objB 是 否 能 被 回收 ? 





[Full GC (System) 0.0149142 secs] 


Heap 


[Tenured: OK->210K(10240K), 


4603K->210K (19456K), [Perm : 


[Times: user=0.01 sys=0.00, real=0.02 secs] 


2999K->2999K (21248K) ]，0.0150007 secs] 


def new generation 
Eden space 8192K, 
from space 1024K, 
to space 1024K, 
tenured generation 
the space 10240K, 
compacting perm gen 
the space 21248K, 


total 9216K, used 82K [0x00000000055e0000, 0x0000000005fe0000, 0x0000000005fe0000) 

1% used [0x00000000055e0000, 0x00000000055£4850, 0x0000000005de0000) 

0% used [0x0000000005de0000, 0x0000000005de0000, 0x0000000005ee0000) 

0% used [0x0000000005ee0000, 0x0000000005ee0000, 0x0000000005fe0000) 

total 10240K, used 210K [0x0000000005fe0000, 0x00000000069e0000, 0x00000000069e0000) 

2% used [0x0000000005fe0000, Ox0000000006014a1l8, 0x0000000006014c00, 0x00000000069e0000) 
total 21248K, used 3016K [0x00000000069e0000, 0x0000000007ea0000, 0x000000000bde0000) 
14% used [0x00000000069e0000, 0x0000000006cd2398, 0x0000000006cd2400,0x0000000007ea0000) 


No shared spaces configured. 








从 运行 结果 中 可 以 清楚 地 看 到 GC 日 志 中 包含 “4603K->210K”， 意 味 着 虚拟 机 并 没有 | 


的 。 


3.2.2， 根 搜索 算法 








在 主流 的 商用 程序 语言 中 (Java 和 C#， 甚 至 包括 前 面 提 到 的 古老 的 Lisp) ， 者 



































计数 算法 来 判断 对 象 是 否 存活 








说 明 虚 拟 机 并 不 是 通过 引 








收 它们 ， 这 也 从 侧 








因为 这 两 个 对 象 互相 引 





就 不 
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根 搜索 算法 (GC Roots Tracing) 判定 对 象 是 否 存活 的 。 这 个 算法 的 基本 思路 就 是 通过 一 系列 的 名 为 “GC 
链 相 连 (用 图 论 的 话 来 说 就 是 从 GC Roots 到 这 个 对 象 不 


了 是 使 
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Roots” 的 对 象 作为 起 始点 ， 从 这 些 节点 开始 向 下 搜索 ， 搜 索 所 走 过 的 路 径 称 为 引 
可 达 ) 时 ， 则 证 明 此 对 象 是 不 可 用 的 。 如 





























在 java 语言 里 ， 可 作为 GC Roots 的 对 象 包括 下 面 几 种 : 





“ 康 拟 机 栈 〈 栈 帧 中 的 本 地 变量 表 ) 中 的 引用 的 对 象 。 


链 (Reference Chain) ， 当 一 个 对 象 到 GC Roots 没 有 任何 引 











3-1 所 示 ， 对 象 object 5、object 6、object 7 虽然 互相 有 关联 ， 但 是 它们 到 GC Roots 是 不 可 达 的 ， 所 以 它们 将 会 被 判定 为 是 可 回收 的 对 象 。 


“ 方法 区 中 的 类 静态 属性 引用 的 对 象 。 


: 方法 区 中 的 常量 引用 的 对 象 。 


“ 本 地 方法 栈 中 JNI ( 即 一 般 说 的 Native 方 法 ) 的 引用 的 对 象 。 





object 5 






object Bb object 了 








国 仍然 存活 的 对 和 象 
加 判定 可 回收 的 对 象 


图 3-1 根 搜索 算法 判定 对 象 是 否 可 回收 


3.2.3 ”再 谈 引用 


无 论 是 通过 引用 计数 算法 判断 对 象 的 引用 数量 ， 还 是 通过 根 搜索 算法 判断 对 象 的 引用 链 是 否 可 达 ， 判 定 对 象 是 否 存 活 都 与 “引用 ”有 关 。 在 JDK 1.2 之 前 ，Java 中 的 引用 的 定义 很 传统 : 如 果 reference 
类 型 的 数据 中 存储 的 数值 代表 的 是 另外 一 块 内 存 的 起 始 地 址 ， 就 称 这 块 内 存 代表 着 一 个 引用 。 这 种 定义 很 纯粹 ， 但 是 太 过 狭隘 ， 一 个 对 象 在 这 种 定义 下 只 有 被 引用 或 者 没有 被 引用 两 种 状态 ， 对 于 如 何 描述 
一 些 “ 食 之 无 味 ， 弃 之 可 惜 ”的 对 象 就 显得 无 能 为 力 。 我 们 希望 能 描述 这 样 一 类 对 象 : 当 内 存 空间 还 足够 时 ， 则 能 保留 在 内 存 之 中 ; 如 果 内 存在 进行 垃圾 收集 后 还 是 非常 紧张 ， 则 可 以 抛弃 这 些 对 象 。 很 多 
系统 的 缓存 功能 都 符合 这 样 的 应 用 场景 。 


在 JDK 1.2 之 后 ，Java 对 引用 的 概念 进行 了 扩充 ， 将 引用 分 为 强 引用 (Strong Reference) 、 软 引用 (Soft Reference) 、 弱 引用 (Weak Reference) 、 虚 引用 (Phantom Reference) 四 种 ， 这 四 
种 引用 强度 依次 逐渐 减弱 。 


“ 强 引用 就 是 指 在 程序 代码 之 中 普遍 存在 的 ， 类 似 “Object obj=new Object0” 这 类 的 引用 ， 只 要 强 引用 还 存在 ， 垃 圾 收集 器 永远 不 会 回收 掉 被 引用 的 对 象 。 
“ 软 引 用 用 来 描述 一 些 还 有 用 ， 但 并 非 必需 的 对 象 。 对 于 软 引 用 关联 着 的 对 象 ， 在 系统 将 要 发 生 内存 洪 出 异常 之 前 ， 将 会 把 这 些 对 象 列 进 回收 范围 之 中 并 进行 第 二 次 回收 。 如 果 这 次 回收 还 是 没有 足够 
的 内 存 ， 才 会 抛 出 内 存 溢出 异常 。 在 JD 多 1.2 之 后 ， 提 供 了 SoftReference 类 来 实现 软 引 用 。 


“ 弱 引 用 也 是 用 来 描述 非 必需 对 象 的 ， 但 是 它 的 强度 比 软 引 用 更 弱 一 些 ， 被 弱 引 用 关联 的 对 象 只 能 生存 到 下 一 次 垃圾 收集 发 生 之 前 。 当 垃圾 收集 器 工作 时 ， 无 论 当 前 内 存 是 否 足 够 ， 都 会 回收 掉 只 被 弱 
引用 关联 的 对 象 。 在 JDK 1.2 之 后 ， 提 供 了 WeakReference 类 来 实现 弱 引 用 。 





“ 庶 引 用 也 称 为 幽灵 引用 或 者 幻影 引用 ， 它 是 最 弱 的 一 种 引用 关系 。 一 个 对 象 是 否 有 庶 引 用 的 存在 ， 完 全 不 会 对 其 生存 时 间 构 成 影响 ， 也 无 法 通过 庶 引 用 来 取得 一 个 对 象 实例 。 为 一 个 对 象 设置 庶 引 用 
关联 的 唯一 目的 就 是 希望 能 在 这 个 对 象 被 收集 器 回收 时 收 到 一 个 系统 通知 。 在 JDK 1.2 之 后 ， 提 供 了 PhantomReference 类 来 实现 虚 引 用 。 


3.2.4 ”生存 还 是 死亡 ? 


在 根 搜索 算法 中 不 可 达 的 对 象 ， 也 并 非 是 “ 非 死 不 可 ”的 ， 这 时 候 它 们 暂时 处 于 “缓刑 ”阶段 ， 要 真正 宣告 一 个 对 象 死亡 ， 至 少 要 经 历 两 次 标记 过 程 : 如 果 对 象 在 进行 根 搜索 后 发 现 没 有 与 GC Roots 相 
连接 的 引用 链 ， 那 它 将 会 被 第 一 次 标记 并 且 进 行 一 次 筛选 ， 筛 选 的 条 件 是 此 对 象 是 否 有 必要 执行 finalize( 方 法 。 当 对 象 没有 覆盖 finalize() 方 法 ， 或 者 finalize() 方 法 已 经 被 虚拟 机 调用 过 ， 虚 拟 机 将 这 两 种 情 
况 都 视 为 “没有 必要 执行 ”。 





如 果 这 个 对 象 被 判定 为 有 必要 执行 finalize() 方 法 ， 那 么 这 个 对 象 将 会 被 放置 在 一 个 名 为 F-Queue 的 队列 之 中 ， 并 在 稍 后 由 一 条 由 虚拟 机 自动 建立 的 、 低 优先 级 的 Finalizer 线 程 去 执行 。 这 里 所 谓 的 “ 执 
行 ” 是 指 虚拟 机 会 触发 这 个 方法 ， 但 并 不 承诺 会 等 待 它 运行 结束 。 这 样 做 的 原因 是 ， 如 果 一 个 对 象 在 finalize() 方 法 中 执行 缓慢 ， 或 者 发 生 了 死 循 环 (更 极端 的 情况 ) ， 将 很 可 能 会 导致 F-Queue 队 列 中 的 其 
他 对 象 永久 处 于 等 待 状态 ， 甚 至 导致 整个 内 存 回收 系统 崩溃 。finalize() 方 法 是 对 象 逃脱 死亡 命运 的 最 后 一 次 机 会 ， 稍 后 GC 将 对 F-Queue 中 的 对 象 进行 第 二 次 小 规模 的 标记 ， 如 果 对 象 要 在 finalize() 中 成 功 拯 























救 自己 一 一 只 要 重新 与 引 


























链 上 的 任何 一 个 对 象 建立 关联 即 可 ， 警 如 把 


自己 (this 关键 字 ) 赋值 给 某 个 类 变量 或 对 象 的 成 员 变量 ， 








没有 逃脱 ， 那 它 就 真 的 离 死 不 远 了 。 从 代码 清和 
代码 清单 3-2 ”一 次 对 象 自我 拯救 的 演示 


/** 
* 此 代码 演示 了 两 点 : 
* 工 .对 象 可 以 在 被 GC 时 自我 拯救 。 


* 2. 这 种 自救 的 机 会 只 有 一 次 ， 因 为 一 个 对 象 的 


* @author zzm 
public class FinalizeEscapeGC { 


3-2 中 我 们 可 以 看 到 一 个 对 象 的 finalize() 被 执行 ， 但 是 它 仍然 可 以 存活 。 





那 在 第 二 次 标记 时 它 将 被 移 除 出 “即将 








回 





收 ” 的 集合 ， 如果 对 象 这 时 候 还 








和 finalize () 方 法 最 多 只 会 被 系统 自动 调用 一 次 


public static FinalizeEscapeGC SAVE HOOK = null; 


public void isAlive() { 


System.out.println("yes, i am still alive :)"); 


QOverride 


protected void finalize() throws Throwable { 


super.finalize(); 


System.out .println ("finalize mehtod executed!"); 


FinalizeEscapeGC.SAVE HOOK = this; 
} 


public static void main(String[] args) throws Throwable { 


SAVE HOOK = new FinalizeEscapeGC(); 
// 对 村 第 一 次 成 功 拯救 自己 

SAVE_ HOOK = null; 

System.gc () 


(7 
// 因为 Finalizer 方 法 优先 级 很 低 ， 暂 停 0.5 秒 ， 以 等 待 它 


Thread. sleep (500); 

if (SAVE HOOK != null) { 
SAVE_ HOOK.isAlive(); 

} else { 


System.out.println("no, i am dead :("); 


} 
// 下 面 这 段 代码 与 上 面 的 完全 相同 ， 但 是 这 次 自救 却 失败 了 


SAVE HOOK = null; 
System.gc () 


(0) 7 
// 因为 Finalizer 方 法 优先 级 很 低 ， 暂 停 0.5 秒 ， 以 等 待 它 


Thread.sleep (500); 

if (SAVE HOOK != null) { 

SAVE HOOK.isAlive(); 

} else { 

System.out.println("no, i am dead 


: ("); 





finalize mehtod executed! 
yes, i am still alive :) 
no, i am dead :( 


从 代码 清单 3-2 的 运行 结果 可 以 看 到 ，SAV 





另外 一 个 值得 注意 的 地 方 就 是 ， 代 码 中 有 两 段 完 全 一 样 的 代码 片段 ， 执 行 结果 却 是 一 次 逃脱 成 功 ， 一 次 失败 ， 这 是 | 
此 第 二 段 代 码 的 





回收 ， 它 的 finalize0 方 法 不 会 被 再 次 执行 ， 





E_HOOK 对 象 的 finalize() 方 法 确实 被 GC 收 集 器 触发 过 ， 并 且 在 被 收集 前 成 功 逃 脱 了 。 





自救 行动 失败 了 。 











需要 特别 说 明 的 是 ， 上 面 关 于 对 象 死亡 时 finalize() 方 法 的 描述 可 能 带 有 悲情 的 艺术 色彩 ， 笔 者 并 不 鼓励 大 家 使 
构 函 数 ， 而 是 Java 刚 诞生 时 为 了 使 C/C+ + 程序 员 更 容易 接受 它 所 做 出 的 一 个 妥协 。 
途 的 一 种 自我 安慰 。finalize() 能 做 的 所 有 工作 ， 使 














作 ， 这 完全 是 对 这 种 方法 的 











3.2.5 ”回收 方法 区 


很 多 人 认为 方法 区 (或 者 HotSpot 虚 拟 机 中 的 永久 代 ) 是 没有 垃圾 收集 的 ，Java 虚 拟 机 规范 中 确实 说 过 可 以 不 要 求 虚 拟 机 在 方法 区 实现 垃圾 收集 ， 而 
进行 一 次 垃圾 收集 一 般 可 以 回收 70%~95% 的 空间 ， 而 永久 代 的 垃圾 收集 效率 远 低 于 此 。 














低 : 在 堆 中 ， 尤 其 是 在 新 生 代 中 ， 常 规 应 
































它 的 运行 代价 高 昂 ， 不 确定 性 大 ， 











因为 任何 一 个 对 象 的 finalize() 方 法 都 只 会 被 系统 


这 种 方法 来 拯救 对 象 。 相 
无 法 保证 各 个 对 象 的 调用 顺序 。 有 些 教材 中 提 到 它 适 合 做 “关闭 外 部 资源 ”之 类 的 工 

















自动 调 








一 次 ， 如 果 对 象 面临 下 一 次 











> 


tc 




















反 ， 笔 者 建议 大 家 尽量 避免 使 用 它 ， 因 为 它 不 是 C/C++ 中 的 析 


























永久 代 的 垃圾 收集 主要 回收 两 部 分 内 容 : 废弃 常量 和 无 





前 系统 没有 任何 一 个 String 对 象 是 叫做 “abc'” 
个 “abc” 常量 就 会 被 系统 “请 ”出 常量 池 。 


常量 池 中 的 其 他 类 ( 接 





的 类 。 回 收 废弃 常量 




















try-finally 或 其 他 方式 都 可 以 做 得 更 好 、 更 及 时 ， 大 家 完全 可 以 忘掉 Java 语 言 中 还 有 这 个 方法 的 存在 。 

















在 方法 区 进行 垃圾 收集 的 “性 价 比 ” 一 般 比较 





与 回收 Java 堆 中 的 对 象 非常 类 似 。 以 常量 池 中 字面 量 的 回收 为 例 ， 假 如 一 个 字符 串 








“abc” 已 经 进入 了 常量 池 中 ， 但 是 当 


























的 ， 换 句 话说 是 没有 任何 String 对 象 引 用 常量 池 中 的 “abc” 常量 ， 也 没有 其 他 地 方 引 














了 这 个 字面 量 ， 如 果 在 这 时 候 发 生 内 存 回收 ， 而 且 必 要 的 话 ， 这 














也 与 此 类 似 。 





) 、 方 法 、 字 段 的 符号 引 






































判定 一 个 常量 是 否 是 “废弃 常量 ”比较 简 自 





和 R， 而 要 判定 一 个 类 是 否 是 “无 





的 类 ”的 条 件 则 














“ 该 类 所 有 的 实例 都 已 经 被 回收 ， 也 就 是 Java 堆 中 不 存在 该 类 的 任何 实例 。 


“加载 该 类 的 ClassLoadet 已 经 被 回收 。 


“ 该 类 对 应 的 java.lang.Class 对 象 没有 在 任何 地 方 被 引用 ， 无 法 在 任何 地 方 通过 反射 访问 该 类 的 方法 。 








虚拟 
可 以 使 


机 可 以 对 满足 上 述 3 个 条 件 的 无 




















类 进行 回收 ， 这 里 说 的 仅仅 是 “可 以 ” ， 而 不 是 和 对 象 一 样 ， 不 使 














是 -XX: +TraceClassLoading 参 数 需要 fastdebug 版 的 虚拟 机 支持 。 











在 大 量 使 




















3.3 ”垃圾 收集 算法 


由 于 垃圾 收集 算法 的 实现 涉及 大 量 的 程序 细节 ， 而 且 各 个 平台 的 虚拟 机 操作 内 存 的 方法 又 各 不 相同 ， 


3.3.1 ”标记 -清除 算法 





最 基础 的 收集 算法 是 “标记 -清除 





相对 苛刻 许多 。 类 需要 同时 满足 下 面 3 个 条 件 才能 算是 “无 

















的 类 ”: 











了 就 必然 会 回收 。 是 否 对 类 进行 回收 ，HotSpot 虚 拟 机 提供 了 -Xnoclassgc 参 数 进行 控制 ， 还 
-verbose: class 及 -XX: +TraceClassLoading、-XX: +TraceClassUnLoading 查 看 类 的 加 载 和 御 载 信息 。-verbose: class 和 -XX: +TraceClassLoading 可 以 在 Product 版 的 虚拟 机 中 使 用 , 但 























射 、 动 态 代理 、CGLib 等 bytecode 框 架 的 场景 ， 以 及 动态 生成 JSP 和 OSGi 这 类 频繁 自 定义 ClassLoader 的 场景 都 需 


虚拟 机 具备 类 卸载 的 功能 ， 以 保证 永久 代 不 会 溢出 。 











(Mark-Sweep) 算法 ， 如 它 的 名 字 一 样 ， 算 法 分 为 “标记 ”和 “清除 ”两 个 阶段 : 首先 标记 出 所 有 需要 回收 
它 的 标记 过 程 其 实在 前 一 节 讲述 对 象 标记 判定 时 已 经 基本 介绍 过 了 。 之 所 以 说 它 是 最 基础 的 收集 算法 ， 是 因为 




















因此 本 节 不 打算 过 多 地 讨论 算法 的 实现 ， 只 是 介绍 几 种 算法 的 思想 及 其 发 展 过 程 。 





的 对 象 ， 在 标记 完成 后 统一 回收 掉 所 有 被 标记 的 对 象 ， 








后 续 的 收集 算法 都 是 基于 这 种 思路 并 对 其 缺点 进行 改进 而 得 到 的 。 它 的 主要 缺点 有 两 个 : 一 个 





运行 过 





图 3-2 所 示 。 











是 效率 问题 ， 标 记 和 清除 过 程 的 效率 都 不 高 ; 另外 一 个 是 空间 问题 ， 标 记 清除 之 后 会 产生 大 量 不 连续 的 内 存 碎 片 ， 空 间 碎 片 太 多 可 能 会 导致 ， 当 程序 在 以 后 的 


的 连续 内 存 而 不 得 不 提前 触发 另 一 次 垃圾 收集 动作 。 标 记 - 清 除 算法 的 执行 过 程 如 


回收 前 状态 : 


回收 后 状态 : 


可 回收 














存活 对 象 


程 中 需要 分 配 较 大 对 象 时 无 法 找到 足够 











完了 ， 就 将 还 存活 着 的 对 象 复 制 到 另 














其 中 的 一 块 。 当 这 一 块 的 内 存 




















页 指针 ， 按 顺序 分 配 内 存 即 可 ， 实 现 简 

















内 存 按 容 量 划分 为 大 小 相等 的 两 块 ， 每 次 只 使 
考虑 内 存 碎片 等 复杂 情况 ， 只 要 移动 堆 
































3.3.2 ”复制 算法 
为 了 解决 效率 问题 ， 一 种 称 为 “复制 ” (Copying) 的 收集 算法 出 现 了 ， 它 将 可 
外 一 块 上 面 ， 然 后 再 把 已 使 用 过 的 内 存 空间 一 次 清理 掉 。 这 样 使 得 每 次 都 是 对 其 中 的 一 块 进行 内 存 回收 ， 内 存 分 配 时 也 就 不 
复制 算法 的 执行 过 程 如 图 3-3 所 示 。 


站 



































































































































回收 前 状态 : 
回收 后 状态 : 
图 3-3 ”复制 算法 示意 图 
现在 的 商业 虚拟 机 都 采用 这 种 收集 算法 来 回收 新 生 代 ，IBM 的 专门 研究 表明 ， 新 生 代 中 的 对 象 98% 是 朝 生 夕 死 的 ， 所 以 并 不 需要 按照 1 : 1 的 比例 来 划分 内 存 空间 ， 而 是 将 内 存 分 为 一 块 较 大 的 Eden 空 间 
和 两 块 较 小 的 Survivor 空 间 ， 每 次 使 用 Eden 和 其 中 的 一 块 Survivorl1]。 当 回收 时 ， 将 Eden 和 Survivor 中 还 存活 着 的 对 象 一 次 性 地 拷贝 到 另外 一 块 Survivor 空 间 上 ， 最 后 清理 掉 Eden 和 刚才 用 过 的 Survivor 的 
内 存 空间 为 整个 新 生 代 容量 的 90% (80%+10%) ， 只 有 10% 的 内 存 是 会 被 “浪费 ”的 。 当 然 ，98% 的 对 象 可 回收 
时 ， 需 要 依赖 其 他 内 存 (这 里 指 老年 代 ) 进行 分 配 担保 (Handle Promotion) 。 





空间 。HotSpot 虚 拟 机 默认 Eden 和 Survivor 的 大 小 比例 是 8 : 1， 也 就 是 每 次 新 生 代 中 可 
只 是 一 般 场景 下 的 数据 ， 我 们 没有 办 法 保证 每 次 回收 都 只 有 不 多 于 10% 的 对 象 存活 ， 当 Survivor 空 间 不 够 


内 存 的 分 配 担保 就 好 比 我 们 去 银行 借款 ， 如 果 我 们 信誉 很 好 ， 在 98% 的 情况 下 都 能 按时 偿还 ， 于 是 银行 可 能 会 默认 我 们 下 一 次 也 能 按时 按 量 地 偿还 贷款 ， 只 需要 有 一 个 担保 人 能 保证 如 果 我 不 能 还 款 
时 ， 可 以 从 他 的 账户 扣 钱 ， 那 银行 就 认为 没有 风险 了 。 内 存 的 分 配 担保 也 一 样 ， 如 果 另 外 一 块 Survivor 空 间 没有 足够 的 空间 存放 上 一 次 新 生 代 收 集 下 来 的 存活 对 象 ， 这 些 对 象 将 直接 通过 分 配 担保 机 制 进入 
老年 代 。 关 于 对 新 生 代 进 行 分 配 担保 的 内 容 ， 本 章 稍 后 在 讲解 垃圾 收集 器 执行 规则 时 还 会 再 详细 讲解 。 























3.3.3 ”标记 -整理 算法 














复制 收集 算法 在 对 象 存活 率 较 高 时 就 要 执行 较 多 的 复制 操作 ， 效 率 将 会 变 低 。 更 关键 的 是 ， 如 果 不 想 浪费 50% 的 空间 ， 就 需要 有 额外 的 空间 进行 分 配 担保 ， 以 应 对 被 使 用 的 内 存 中 所 有 对 象 都 100% 存 活 
的 极端 情况 ， 所 以 在 老年 代 一 般 不 能 直接 选用 这 种 算法 。 














根据 老年 代 的 特点 ， 有 人 提出 了 另外 一 种 “标记 -整理 ” (Mark-Compact) 算法 ， 标 记过 程 仍然 与 “标记 -清除 ”算法 一 样 ， 但 后 续 步 又 不 是 直接 对 可 回收 对 象 进行 清理 ， 而 是 让 所 有 存活 的 对 象 都 向 
一 端 移动 ， 然 后 直接 清理 掉 端 边界 以 外 的 内 存 ，“ 标 记 -整理 ”算法 的 示意 图 如 图 3-4 所 示 。 


























回收 前 状态 : 





存活 对 象 可 回收 未 使 用 


图 3-4 “标记 -整理 ”算法 示意 图 














3.3.4 分 代 收 集 算法 





当前 商业 虚拟 机 的 垃圾 收集 都 采用 “分 代 收 集 ” (Generational Collection) 算法 ， 这 种 算法 并 没有 什么 新 的 思想 ， 只 是 根据 对 象 的 存活 周期 的 不 同 将 内 存 划 分 为 几 块 。 一 般 是 把 Java 堆 分 为 新 生 代 和 
老年 代 ， 这 样 就 可 以 根据 各 个 年 代 的 特点 采用 最 适当 的 收集 算法 。 在 新 生 代 中 ， 每 次 垃圾 收集 时 都 发 现 有 大 批 对 象 死去 ， 只 有 少量 存活 ， 那 就 选用 复制 算法 ， 只 需要 付出 少量 存活 对 象 的 复制 成 本 就 可 以 完 
成 收集 。 而 老年 代 中 因为 对 象 存活 率 高 、 没 有 额外 空间 对 它 进行 分 配 担保 ， 就 必须 使 用 “标记 -清理 ”或 “标记 -整理 ”算法 来 进行 回收 。 






























































四 这 里 需要 说 明 一 下 ， 在 HotSpot 的 分 代 收集 中 ， 新 生 代 最 初 就 是 这 种 布局 ， 与 “IBM 的 研究 ”并 没有 实际 联系 。 本 书 列举 IBM 的 研究 只 是 为 了 说 明 这 种 分 代 布 局 的 意义 所 在 。 


3.4 垃圾 收集 器 











如 果 说 收集 算法 是 内 存 回收 的 方法 论 ， 垃 圾 收集 器 就 是 内 存 回 收 的 具体 实现 。Java 虚 拟 机 规范 中 对 垃圾 收集 器 应 该 如 何 实现 并 没有 任何 规定 ， 因 此 不 同 的 厂商、 不 同 版 本 的 虚拟 机 所 提供 的 垃圾 收集 器 
都 可 能 会 有 很 大 的 差别 ， 并 且 一 般 都 会 提供 参数 供用 户 根据 自己 的 应 用 特点 和 要 求 组 合 出 各 个 年 代 所 使 用 的 收集 器 。 这 里 讨论 的 收集 器 基于 Sun HotSpot 虚 拟 机 1.6 版 Update 22， 这 个 虚拟 机 包含 的 所 有 收 
集 器 如 图 3-5 所 示 。 


ry 
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Serial Old 
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图 3-5 ”HotSpotJVM1.6 的 垃圾 收集 器 趾 























图 3-5 展 示 了 7 种 作用 于 不 同 分 代 的 收集 器 (包括 JDK 1.6_Update14 后 引入 的 Early Access 版 61 收集 器 ) ， 如 果 两 个 收集 器 之 间 存 在 连 线 ， 就 说 明 它们 可 以 搭配 使 用 。 














在 介绍 这 些 收集 器 各 自 的 特性 之 前 ， 我 们 先 来 明确 一 个 观点 : 虽然 我 们 是 在 对 各 个 收集 器 进行 比较 ， 但 并 非 为 了 挑选 一 个 最 好 的 收集 器 出 来 。 因 为 直到 现在 为 止 还 没有 最 好 的 收集 器 出 现 ， 更 加 没有 万 


能 的 收集 器 ， 所 以 我 们 选择 的 只 是 对 具体 应 用 最 合适 的 收集 器 。 这 点 不 需要 多 加 解释 就 能 证 明 : 如 果 有 一 种 放 之 四 海源 准 、 任 何 场景 下 都 适用 的 完美 收集 器 存在 ， 那 HotSpot 虚 拟 机 就 没 必要 实现 那么 多 不 
同 的 收集 器 了 。 


















































3.4.1 ”Serial 收 集 器 


Serial 收 集 器 是 最 基本 、 历 史 最 悠久 的 收集 器 ， 曾 经 (在 JDK 1.3.1 之 前 ) 是 虚拟 机 新 生 代 收 集 的 唯一 选择 。 大 家 看 名 字 就 知道 ， 这 个 收集 器 是 一 个 单线 程 的 收集 器 ， 但 它 的 “单线 程 ”的 意义 并 不 仅仅 
是 说 明 它 只 会 使 用 一 个 CPU 或 一 条 收集 线程 去 完成 垃圾 收集 工作 ， 更 重要 的 是 在 它 进行 垃圾 收集 时 ， 必 须 暂 停 其 他 所 有 的 工作 线程 (Sun 将 这 件 事情 称 之 为 “Stop The World”) ， 直 到 它 收 集结 束 。 
“Stop The World” 这 个 名 字 也 许 听 起 来 很 酷 ， 但 这 项 工作 实际 上 是 由 虚拟 机 在 后 台 自 动 发 起 和 自动 完成 的 ， 在 用 户 不 可 见 的 情况 下 把 用 户 的 正常 工作 的 线程 全 部 停 掉 ， 这 对 很 多 应 用 来 说 都 是 难以 接受 
的 。 你 想 想 ， 要 是 你 的 电脑 每 运行 一 个 小 时 就 会 暂停 响应 5 分 钟 ， 你 会 有 什么 样 的 心情 ? 图 3-6 示 意 了 Serial/Serial Old 收集 器 的 运行 过 程 。 



































对 于 “Stop The World” 带 给 用 户 的 恶劣 体验 ， 虚 拟 机 的 设计 者 们 表示 完全 理解 ， 但 也 表示 非常 委屈 : “你 妈妈 在 给 你 打扫 房间 的 时 候 ， 肯 定 也 会 让 你 老 老实 实地 在 椅子 上 或 房间 外 待 着 ， 如 果 她 一 边 
打扫 ， 你 一 边 乱 扔 纸 属 ， 这 房间 还 能 打扫 完 吗 ? ”这 确实 是 一 个 合情合理 的 矛盾 ， 虽 然 垃圾 收集 这 项 工作 听 起 来 和 打扫 房间 属于 一 个 性 质 的 ， 但 实际 上 肯定 还 要 比 打扫 房间 复杂 得 多 啊 ! 
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图 3-6 ”Serial/Serial Old 收集 器 运行 示意 图 











从 JDK 1.3 开 始 ， 一 直到 现在 还 没 正式 发 布 的 JDK 1.7，HotSspot 虚 拟 机 开发 团队 为 消除 或 减少 工作 线程 因 内 存 回 收 而 导致 停顿 的 努力 一 直 在 进行 着 ， 从 Serial 收 集 器 到 Parallel 收 集 器 ， 再 到 Concurrent 
Mark Sweep (CMS) 现在 还 未 正式 发 布 的 Garbage First (G1) 收集 器 ， 我 们 看 到 了 一 个 个 越 来 越 优秀 (也 越 来 越 复 杂 ) 的 收集 器 的 出 现 ， 用 户 线程 的 停顿 时 间 在 不 断 缩短 ， 但 是 仍然 没有 办 法 完全 消除 
(这 里 暂 不 包括 RTSJ 中 的 收集 器 ) 。 寻 找 更 优秀 的 垃圾 收集 器 的 工作 仍 在 继续 ! 



























































写 到 这 里 ， 笔 者 似乎 已 经 把 Serial 收 集 器 描述 成 一 个 老 而 无 用 ， 食 之 无 味 弃 之 可 惜 的 鸡肋 了 ， 但 实际 上 到 现在 为 止 ， 它 依然 是 虚拟 机 运行 在 Client 模 式 下 的 默认 新 生 代 收 集 器 。 它 也 有 着 优 于 其 他 收集 器 
的 地 方 : 简单 而 高 效 《与 其 他 收集 器 的 单线 程 比 ) ， 对 于 限定 单个 CPU 的 环境 来 说 ，Serial 收 集 器 由 于 没有 线程 交互 的 开销 ， 专 心 做 垃圾 收集 自然 可 以 获得 最 高 的 单线 程 收集 效率 。 在 用 户 的 桌面 应 用 场景 
中 ， 分 配给 虚拟 机 管理 的 内 存 一 般 来 说 不 会 很 大 ， 收 集 几 十 兆 甚 至 一 两 百 兆 的 新 生 代 (仅仅 是 新 生 代 使 用 的 内 存 ， 桌 面 应 用 基本 上 不 会 再 大 了 ) ， 停 顿时 间 完 全 可 以 控制 在 几 十 毫秒 最 多 一 百 多 毫秒 以 内 ， 
只 要 不 是 频繁 发 生 ， 这 点 停顿 是 可 以 接受 的 。 所 以 ，Serial 收 集 器 对 于 运行 在 Client 模 式 下 的 虚拟 机 来 说 是 一 个 很 好 的 选择 。 





































































































3.4.2 ”ParNew 收 集 器 














ParNew 收 集 器 其 实 就 是 Serial 收 集 器 的 多 线程 版 本 ， 除 了 使 用 多 条 线程 进行 垃圾 收集 之 外 ， 其 余 行 为 包括 Serial 收 集 器 可 用 的 所 有 控制 参数 (例如: -XX: SurvivorRatio、-XX: 
PretenureSizeThreshold、-XX: HandlePromotionFailure 等 ) 、 收 集 算法 、Stop The World、 对 象 分 配 规则 、 回 收 策略 等 都 与 Serial 收 集 器 完全 一 样 ， 实 现 上 这 两 种 收集 器 也 共用 了 相当 多 的 代码 。 
ParNew 收 集 器 的 工作 过 程 如 图 3-7 所 示 。 
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图 3-7 ParNew/Setrial Old 收集 器 运行 示意 图 











ParNew 收 集 器 除了 多 线程 收集 之 外 ， 其 他 与 Serial 收 集 器 相 比 并 没有 太 多 创新 之 处 ， 但 它 却 是 许多 运行 在 Server 模 式 下 的 虚拟 机 中 首选 的 新 生 代 收 集 器 ， 其 中 有 一 个 与 性 能 无 关 但 很 重要 的 原因 是 ， 除 
了 serial 收集 器 外 ， 目 前 只 有 它 能 与 CMS 收集 器 配合 工作 。 在 JDK 1.5 时 期 ，HotSpot 推 出 了 一 款 在 强 交 互 应 用 中 几乎 可 称 为 有 划时代 意义 的 垃圾 收集 器 一 一 CMS 收集 器 (Concurrent Mark Sweep， 本 节 
稍 后 将 详细 介绍 这 款 收 集 器 ) ， 这 款 收集 器 是 HotSpot 虚 拟 机 中 第 一 款 真正 意义 上 的 并 发 (Concurrent) 收集 器 ， 它 第 一 次 实现 了 让 垃圾 收集 线程 与 用 户 线程 (基本 上 ) 同时 工作 ， 用 前 面 那个 例子 的 话 来 
说 ,就 是 做 到 了 在 你 妈妈 打扫 房间 的 时 候 你 还 能 同时 往 地 上 扔 纸 屑 。 









































不 幸 的 是 ， 它 作为 老年 代 的 收集 器 ， 却 无 法 与 JDK 1.4.0 中 已 经 存在 的 新 生 代 收 集 器 Parallel Scavenge 配 合 工 作 [外 ， 所 以 在 JDK 1.5 中 使 用 CMS 来 收集 老年 代 的 时 候 ， 新 生 代 只 能 选择 ParNew 或 Serial 收 
集 器 中 的 一 个 。ParNew 收 集 器 也 是 使 用 -XX: +UseConcMarkSweepGC 选 项 后 的 默认 新 生 代 收 集 器 ， 也 可 以 使 用 -XX: +UseParNewGC 选 项 来 强制 指定 它 。 




















ParNew 收 集 器 在 单 CPU 的 环境 中 绝对 不 会 有 比 Serial 收 集 器 更 好 的 效果 ， 甚 至 由 于 存在 线程 交互 的 开销 ， 该 收集 器 在 通过 超 线程 技术 实现 的 两 个 CPU 的 环境 中 都 不 能 百分之百 地 保证 能 超越 Serial 收 集 
器 。 当 然 ， 随 着 可 以 使 用 的 CPU 的 数量 的 增加 ， 它 对 于 GC 时 系统 资源 的 利用 还 是 很 有 好 处 的 。 它 默认 开启 的 收集 线程 数 与 CPU 的 数量 相同 ， 在 CPU 非常 多 ( 壁 如 32 个 ， 现 在 CPU 动 辆 就 4 核 加 超 线 程 ， 服 务 
器 超过 32 个 逻辑 CPU 的 情况 越 来 越 多 了 ) 的 环境 下 ， 可 以 使 用 -XX: ParallelGCThreads 参 数 来 限制 垃圾 收集 的 线程 数 。 




































































注意 ”从 ParNew 收 集 器 开始 ， 后 面 还 将 会 接触 到 几 款 并 发 和 并 行 的 收集 器 。 在 大 家 可 能 产生 疑惑 之 前 ， 有 必要 先 解释 两 个 名 词 : 并 发 和 并 行 。 这 两 个 名 词 都 是 并 发 编程 中 的 概念 ， 在 谈论 垃圾 收集 器 的 
上 下 文 语 境 中 ， 他 们 可 以 解释 为 : 


“并行 (Parallel) : 指 多 条 垃圾 收集 线程 并 行 工 作 ， 但 此 时 用 户 线程 仍然 处 于 等 待 状态 。 


“并 发 (Concurrent) : 指 用 户 线程 与 垃圾 收集 线程 同时 执行 (但 不 一 定 是 并 行 的 ， 可 能 会 交替 执行 ) ， 用 户 程序 继续 运行 ， 而 垃圾 收集 程序 运行 于 另 一 个 CPU 上 。 


3.4.3 Parallel Scavenge 收 集 器 


























Parallel Scavenge 收 集 器 也 是 一 个 新 生 代 收 集 器 ， 它 也 是 使 用 复制 算法 的 收集 器 ， 又 是 并 行 的 多 线程 收集 器 .….. 看 上 去 和 ParNew 都 一 样 ， 那 它 有 什么 特别 之 处 呢 ? 























Parallel Scavenge 收 集 器 的 特点 是 它 的 关注 点 与 其 他 收集 器 不 同 ，CMS 等 收集 器 的 关注 点 尽 可 能 地 缩短 垃圾 收集 时 用 户 线程 的 停顿 时 间 ， 而 Parallel Scavenge 收 集 器 的 目标 则 是 达到 一 个 可 控制 的 知 
吐 量 (Throughput) 。 所 谓 吞 吐 量 就 是 CPU 用 于 运行 用 户 代 码 的 时 间 与 CPU 总 消耗 时 间 的 比值 ， 即 吞吐 量 = 运行 用 户 代码 时 间 / (运行 用 户 代码 时 间 + 垃 圾 收集 时 间 ) ,虚拟 机 总 共 运 行 了 100 分 钟 ， 其 中 垃 
圾 收集 花 掉 1 分 钟 ， 那 吞吐 量 就 是 99%。 







































































停顿 时 间 越 短 就 越 适 合 需要 与 用 户 交 互 的 程序 ， 良 好 的 响应 速度 能 提升 用 户 的 体验 ; 而 高 吞吐 量 则 可 以 最 高 效率 地 利用 CPU 时 间 ， 尽 快 地 完成 程序 的 运算 任务 ， 主 要 适合 在 后 台 运算 而 不 需要 太 多 交互 
的 任务 。 















































Parallel Scavenge 收 集 器 提供 了 两 个 参数 用 于 精确 控制 吞吐 量 ， 分 别 是 控制 最 大 垃圾 收集 停顿 时 间 的 -XX: MaxGCPauseMillis 参 数 及 直接 设置 吞吐 量 大 小 的 -XX: GCTimeRatio 参 数 。 

















MaxGCPauseMillis 参 数 允 许 的 值 是 一 个 大 于 0 的 毫秒 数 ， 收 集 器 将 尽力 保证 内 存 回 收 花费 的 时 间 不 超过 设 定 值 。 不 过 大 家 不 要 异想天开 地 认为 如 果 把 这 个 参数 的 值 设置 得 稍 小 一 点 就 能 使 得 系统 的 垃圾 
收集 速度 变 得 更 快 ，GC 停 顿时 间 缩 短 是 以 牺牲 吞吐 量 和 新 生 代 空间 来 换取 的 : 系统 把 新 生 代 调 小 一 些 ， 收 集 300MB 新 生 代 肯 定 比 收集 500MB 快 吧 ， 这 也 直接 导致 垃圾 收集 发 生得 更 频繁 一 些 ， 原 来 10 秒 收 























集 一 次 、 每 次 停顿 100 毫 秒 ， 现 在 变 成 5 秒 收集 一 次 、 每 次 停顿 70 毫 秒 。 停 顿时 间 的 确 在 下 降 ， 但 吞吐 量 也 降下 来 了 。 


GCTimeRatio 参 数 的 值 应 当 是 一 个 大 了 





0 小 于 100 的 整数 ， 也 就 是 垃圾 收集 时 间 占 总 时 间 的 比率 ， 相 当 于 是 吞吐 量 的 倒数 。 如 果 把 此 参数 设置 为 19， 那 允许 的 最 大 GC 时 间 就 占 总 时 间 的 5% ( 即 











1/ (1+19) ) ， 默 认 值 为 99， 就 是 允许 最 大 1% ( 即 1/ (1+99) ) 的 垃圾 收集 时 间 。 


由 于 与 吞吐 量 关系 密切 ，Parallel Scavenge 收 集 器 也 经 常 被 称 为 “吞吐 量 优先 ”收集 器 。 除 上 述 两 个 参数 之 外 ，Parallel Scavenge 收 集 器 还 有 一 个 参数 -XX: +UseAdaptiveSizePolicy 值 得 关注 。 这 是 
一 个 开关 参数 ， 当 这 个 参数 打开 之 后 ， 就 不 需要 手工 指定 新 生 代 的 大 小 (-Xmn) 、Eden 与 Survivor 区 的 比例 (-XX: SurvivorRatio) 、 晋 升 老年 代 对 象 年 龄 (-XX: PretenureSizeThreshold) 等 细节 参 





数 了 ， 虚 拟 机 会 根据 当前 系统 的 运行 








3.4.4 Serial Old 收集 器 


Serial Old 是 serial 收集 器 的 老年 代 版 本 ， 它 同样 是 一 个 单线 程 收集 器 ， 使 
途 : 一 个 是 在 JDK 1.5 及 之 前 的 版 本 中 与 Parallel Scavenge 收 集 器 搭配 使 
容 































































































中 详细 讲解 。Serial Old 收集 器 的 工作 过 程 如 图 3-8 所 示 。 











CPU 0 用 P 线 种 
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CPYUe 用 户 线程 4 暂停 所 有 用 户 线程 
CPU 3 


3.4.5 ”Parallel Old 收集 器 


Safepoint 








Parallel Old 是 Parallel Scavenge 收 集 器 的 老年 代 版 本 ， 使 用 多 线程 和 “标记 
的 状态 。 原 因 是 ， 如 果 新 生 代 选 择 了 Parallel Scavenge 收 集 器 ， 老 年 代 除 了 Serial 








吗 ? ) 。 由 于 单线 程 的 老年 代 Serial Old 收集 器 在 服务 端 应 用 性 能 上 的 “拖累 ”， 即 便 使 用 了 Parallel Scavenge 收 集 器 也 未 必 能 在 整体 应 用 上 获得 吞吐 量 最 大 化 的 效果 ， 又 因为 老年 代 收 集中 无 法 充分 利 














服务 器 多 CPU 的 处 理 能 力 ， 在 老生 
























































“标记 -整理 ”算法 。 这 个 收集 器 的 主要 意义 也 是 被 Client 模 式 下 的 虚拟 机 使 用 。 如 果 在 Server 模 式 下 ， 它 主要 还 有 两 大 
和 内， 另外 一 个 就 是 作为 CMS 收集 器 的 后 备 预案 ， 在 并 发 收集 发 生 Concurrent Mode Failure 的 时 候 使 


























老年 代 采 取 标 记 - 整理 算法 
暂停 所 有 用 户 线程 


Safepoint 


图 3-8 ”Serial/Serial Old 收集 器 运行 示意 图 











- 整理 ”算法 。 这 个 收集 器 是 在 JDK 1.6 中 才 开 始 提供 的 ， 在 此 之 前 ， 新 生 代 的 Parallel Scavenge 收 集 器 一 直 处 于 比较 烙 























Old (PS MarkSweep) 收集 器 外 别 无 选择 (还 记得 上 面 说 过 Parallel Scavenge 收 集 器 无 法 与 CMS 收集 器 配合 工作 
































直到 Parallel Old 收集 器 出 现 后 ，“ 知 吐 量 优先 ”收集 器 终于 有 了 比较 名 副 其 实 的 应 用 组 合 ， 在 注 





Old 收集 器 的 工作 过 程 如 图 3-9 所 示 。 











CPUD 用 户 线 程 1 
CPU 1 用 户 线 程 2 
CPU 2 用 户 线 程 3 
CPU 3 用 户 线 程 4 
Safepoint 
图 3.9 
3.4.6 “CMS 收集 器 


CMS (Concurrent Mark Sweep) 收集 器 是 一 种 以 获取 最 短 回收 停顿 时 间 为 目标 的 收集 器 。 目 前 很 大 一 部 分 的 Java 应 用 都 集中 在 互联 网 站 或 B/S 系 统 的 服务 端 上 ， 这 类 应 用 尤其 重视 服务 的 响应 速 








F 代 很 大 而 且 硬 件 比较 高 级 的 环境 中 ， 这 种 组 合 的 吞吐 量 甚至 还 不 一 定 有 ParNew 加 CMS 的 组 合 “ 给 力 ”。 











情况 收集 性 能 监控 信息 ， 动 态 调整 这 些 参数 以 提供 最 合适 的 停顿 时 间或 最 大 的 吞吐 量 ， 这 种 调节 方式 称 为 GC 自 适应 的 调节 策略 (GC Ergonomics) J。 如 果 读 者 对 于 
收集 器 运作 原理 不 太 了 解 ， 手 工 优化 存在 困难 的 时 候 ， 使 用 Parallel Scavenge 收 集 器 配合 自 适 应 调节 策略 ， 把 内 存 管理 的 调 优 任务 交 给 虚拟 机 去 完成 将 是 一 个 很 不 错 的 选择 。 只 需要 把 基本 的 内 存 数据 设置 
好 (如 -Xmx 设 置 最 大 堆 ) ， 然 后 使 用 MaxGCPauseMillis 参 数 (更 关注 最 大 停顿 时 间 ) 或 GCTimeRatio 参 数 (更 关注 吞吐 量 ) 给 虚拟 机 设立 一 个 优化 目标 ， 那 
自 适应 调节 策略 也 是 Parallel Scavenge 收 集 器 与 ParNew 收 集 器 的 一 个 区 别 。 


体 细节 参数 的 调节 工作 就 由 虚拟 机 完成 了 。 




















。 这 两 点 都 将 在 后 面 的 内 
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Safepoint 


Parallel Scavenge/Parallel Old 收集 器 运行 示意 图 






































希望 系统 停顿 时 间 最 短 ， 以 给 用 户 带 来 较 好 的 体验 。CMS 收 集 器 就 非常 符合 这 类 应 用 的 需求 。 

















从 名 字 (包含 “Mark Sweep”) 上 就 可 以 看 出 CMS 收 集 器 是 基于 “标记 -清除 ”算法 实现 的 ， 它 的 运作 过 程 相对 于 前 面 几 种 收集 器 来 说 要 更 复杂 一 些 ， 整 个 过 程 分 为 4 个 步骤 ,包括 : 


“ 初始 标记 (CMS initial mark) 


“ 并 发 标记 (CMS concurrent mark) 


' 重新 标记 (CMS remark) 


“ 并 发 清除 (CMS concurrent sweep) 

















标记 阶段 则 是 为 了 修正 并 发 标记 期 间 ， 因 用 户 程 序 继续 运作 而 导致 标记 产生 变动 的 











那 一 部 分 对 象 的 标记 记录 ， 这 个 阶段 的 停顿 时 间 一 般 会 比 初始 标记 阶段 稍 长 一 些 ， 但 远 比 并 发 标记 的 时 间 短 。 








由 于 整个 过 程 中 耗 时 最 长 的 并 发 标记 和 并 发 清除 过 程 中 ， 收 集 器 线程 都 可 以 与 
清楚 地 看 到 CMS 收集 器 的 运作 步骤 中 并 发 和 需要 停顿 的 时 间 。 





























线程 一 起 工作 ， 所 以 总 体 上 来 说 ，CMS 收 集 器 的 内 存 回收 过 程 是 与 用 户 线程 一 起 并 发 地 执行 的 。 通 过 图 3-10 可 以 



































吞吐 量 及 CPU 资源 敏感 的 场合 ， 都 可 以 优先 考虑 Parallel Scavenge 加 Parallel Old 收 集 器 。Parallel 





网 


其 中 初始 标记 、 重 新 标记 这 两 个 步骤 仍然 需要 “Stop The World”。 初 始 标记 仅仅 只 是 标记 一 下 GC Roots 能 直接 关联 到 的 对 象 ， 速 度 很 快 ， 并 发 标记 阶段 就 是 进行 GC Roots Tracing 的 过 程 ， 而 重新 





比较 








CPUD 用 户 线程 1 用 户 线程 1 用 户 线程 1 用 户 线程 1 
CPU 1 用 户 线程 2 i 用 户 线程 2 用 户 线程 2 用 户 线程 2 
CPU 2 用 户 线 程 3 i 其 发 法 理 Se 二 
CPU 3 用 户 线程 4 用 户 线程 4 用 户 线程 4 用 户 线程 3 
Safepoint Safepoint Safepoint Safepoint Safepoint 











图 3-10 ”Concurrent Matk Sweep 收 集 器 运行 示意 








CMS 是 一 款 优秀 的 收集 器 ， 它 的 最 主要 优点 在 名 字 上 已 经 体现 出 来 了 : 并 发 收集 、 低 停顿 ，Sun 的 一 些 官方 文档 里 面 也 称 之 为 并 发 低 停顿 收集 器 (Concurrent Low Pause Collector) 。 但 是 CMS 还 远 
达 不 到 完美 的 程度 ， 它 有 以 下 三 个 显著 的 缺点 : 











: CMS 收集 器 对 CPU 资源 非常 敏感 。 其 实 ， 面 向 并 发 设计 的 程序 都 对 CPU 资源 比较 敏感 。 在 并 发 阶段 ， 它 虽然 不 会 导致 用 户 线程 停顿 ， 但 是 会 因为 占用 了 一 部 分 线程 或 者 说 CPU 资源 ) 而 导致 应 用 程序 
变 慢 ， 总 吞吐 量 会 降低 。CMS 黑 认 启 动 的 回收 线程 数 是 〈CPU 数 量 +3) /4， 也 就 是 当 CPU 在 4 个 以 上 时 ， 并 发 回收 时 垃圾 收集 线程 最 多 占用 不 超过 25% 的 CPU 资源 。 但 是 当 CPU 不 足 4 个 时 (譬如 2 个 ) ， 那么 
CMS 对 用 户 程序 的 影响 就 可 能 变 得 很 大 ， 如 果 CPU 和 负载 本 来 就 比较 大 的 时 候 ， 还 分 出 一 半 的 运算 能 力 去 执行 收集 器 线程 ， 就 可 能 导致 用 户 程序 的 执行 速度 忽然 降低 了 50%， 这 也 很 让 人 受 不 了 。 为 了 解决 这 种 
情况 ， 虚 拟 机 提供 了 一 种 称 为 “ 增 量 式 并 发 收集 器 ” (Incremental Concurrent Matk Sweep/i-CMS) 的 CMS 收集 器 变种 ， 所 做 的 事情 和 单 CPU 年 代 PC 机 操作 系统 使 用 抢占 式 来 模拟 多 任务 机 制 的 思想 一 样 ， 就 是 
在 并 发 标记 和 并 发 清理 的 时 候 让 GC 线 程 、 用 户 线程 交替 运行 ， 尽 量 减少 GC 线 程 的 独占 资源 的 时 间 ， 这 样 整个 垃圾 收集 的 过 程 会 更 长 ， 但 对 用 户 程序 的 影响 就 会 显得 少 一 些 ， 速 度 下 降 也 就 没有 那么 明显 ， 
但 是 目前 版 本 中 ，i-CMS 已 经 被 声明 为 “deprecated”， 即 不 再 提倡 用 户 使 用 。 


“CMS 收集 器 无 法 处 理 浮动 垃圾 (Floating Garbage) ， 可 能 出 现 “Concurrent Mode Failure” 失 败 而 导致 另 一 次 Full GC 的 产生 。 由 于 CMS 并 发 清理 阶段 用 户 线程 还 在 运行 着 ， 伴 随 程序 的 运行 自然 还 会 有 新 
的 垃圾 不 断 产 生 ， 这 一 部 分 垃圾 出 现在 标记 过 程 之 后 ，CMS 无 法 在 本 次 收集 中 处 理 掉 它们 ， 只 好 留待 下 一 次 GC 时 再 将 其 清理 挤 。 这 一 部 分 垃圾 就 称 为 “浮动 垃圾 ”。 也 是 由 于 在 垃圾 收集 阶段 用 户 线 程 还 需 
要 运行 ， 即 还 需要 预 留 足够 的 内 存 空间 给 用 户 线 程 使 用 ， 因 此 CMS 收 集 器 不 能 像 其 他 收集 器 那样 等 到 老年 代 几 乎 完全 被 填 满 了 再 进行 收集 ， 需 要 预 留 一 部 分 空间 提供 并 发 收集 时 的 程序 运作 使 用 。 在 默认 设 
置 下 ，CMS 收 集 器 在 老年 代 使 用 了 68% 的 空间 后 就 会 被 激活 ， 这 是 一 个 偏 保守 的 设置 ， 如 果 在 应 用 中 老年 代 增 长 不 是 太 快 ， 可 以 适当 调 高 参数 -XX: CMSInitiatingOccupancyFraction 的 值 来 提高 触发 百分比 ， 以 
便 降低 内 存 回 收 次 数 以 获取 更 好 的 性 能 。 要 是 CMS 运 行 期 间 预 留 的 内 存 无 法 满足 程序 需要 ， 就 会 出 现 一 次 “Concurrent Mode Failure” 失 败 ， 这 时 候 虚 拟 机 将 启动 后 备 预案 : 临时 启用 Serial Old 收集 器 来 重新 





进行 老年 代 的 垃圾 收集 ， 这 样 停顿 时 间 就 很 长 了 。 所 以 说 参数 -XX: CMSInitiatingOccupancyFraction 设 置 得 太 高 将 会 很 容易 导致 大 量 “Concurrent Mode Failure” 失败， 性 能 反而 降低 。 


“ 还 有 最 后 一 个 缺点 ， 在 本 节 在 开头 说 过 ，CMS 是 一 款 基于 “标记 -清除 ”算法 实现 的 收集 器 ， 如 果 读 者 对 前 面 这 种 算法 介绍 还 有 印象 的 话 ， 就 可 能 想到 这 意味 着 收集 结束 时 会 产生 大 量 空间 碎片 。 空 间 
碎片 过 多 时 ， 将 会 给 大 对 象 分 配 带 来 很 大 的 麻烦 ， 往 往 会 出 现 老年 代 还 有 很 大 的 空间 剩余 ， 但 是 无 法 找到 足够 大 的 连续 空间 来 分 配 当前 对 象 ， 不 得 不 提前 触发 一 次 Full GC。 为 了 解决 这 个 问题 CMS 收集 器 
提供 了 一 个 -XX: +UseCMSCompactAtFullCollection 开 关 参 数 ， 用 于 在 “享受 ” 完 Full GC 服 务 之 后 额外 免费 附送 一 个 碎片 整理 过 程 ， 内 存 整理 的 过 程 是 无 法 并 发 的 。 空 间 碎片 问题 没有 了 ， 但 停顿 时 间 不 得 不 
变 长 了 。 虚 拟 机 设计 者 们 还 提供 了 另外 一 个 参数 -XX: CMSFullGCsBeforeCompaction， 这 个 参数 用 于 设置 在 执行 多 少 次 不 压缩 的 Full GC 后 ， 跟 着 来 一 次 带 压 缩 的 。 


3.4.7 ”G1 收集 器 

















G1 (Garbage First) 收集 器 是 当前 收集 器 技术 发 展 的 最 前 沿 成 果 ， 在 JDK 1.6_Update14 中 提供 了 Early Access 版 本 的 G1 收集 器 以 供 试用 。 在 将 来 JDK 1.7 正 式 发 布 的 时 候 ，G1 收 集 器 很 可 能 会 有 一 个 
成 熟 的 商用 版 本 随 之 发 布 。 这 里 只 对 G1 收 集 器 进行 简单 介绍 口 。 











G1 收集 器 是 垃圾 收集 器 理论 进一步 发 展 的 产物 ， 它 与 前 面 的 CMS 收 集 器 相 比 有 两 个 显著 的 改进 : 一 是 G1 收集 器 是 基于 “标记 -整理 ”算法 实现 的 收集 器 ， 也 就 是 说 它 不 会 产生 空间 碎片 ， 这 对 于 长 时 间 
运行 的 应 用 系统 来 说 非常 重要 。 二 是 它 可 以 非常 精确 地 控制 停顿 ， 既 能 让 使 用 者 明确 指定 在 一 个 长 度 为 M 毫 秒 的 时 间 片 段 内 ， 消 耗 在 垃圾 收集 上 的 时 间 不 得 超过 N 毫 秒 ， 这 几乎 已 经 是 实时 Java (RTSJ) 的 
垃圾 收集 器 的 特征 了 。 












































G1 收 集 器 可 以 实现 在 基本 不 牺牲 吞吐 量 的 前 提 下 完成 低 停顿 的 内 存 回 收 ， 这 是 由 于 它 能 够 极力 地 避免 全 区 域 的 垃圾 收集 ， 之 前 的 收集 器 进行 收集 的 范围 都 是 整个 新 生 代 或 老年 代 ， 而 G1 将 整个 java 堆 
(包括 新 生 代 、 老 年 代 ) 划分 为 多 个 大 小 固定 的 独立 区 域 (Region) ， 并 且 跟 踪 这 些 区 域 里 面 的 垃圾 堆积 程度 ， 在 后 台 维护 一 个 优先 列表 ， 每 次 根据 允许 的 收集 时 间 ， 优 先 回收 垃圾 最 多 的 区 域 (这 就 是 
Garbage First 名 称 的 来 由 ) 。 区 域 划分 及 有 优先 级 的 区 域 回收 ， 保 证 了 G1 收 集 器 在 有 限 的 时 间 内 可 以 获得 最 高 的 收集 效率 。 
























































3.4.8 垃圾 收集 器 参数 总 结 


JDK 1.6 中 的 各 种 垃圾 收集 器 到 此 已 全 部 介绍 完毕 ， 在 描述 过 程 中 提 到 了 很 多 虚拟 机 非 稳 定 的 运行 参数 ， 表 3-1 整 理 了 这 些 参数 以 供 读者 实践 时 参考 。 





表 3-1 垃圾 收集 相关 的 常用 参数 


参 数 描 述 
虚拟 机 运行 在 Client 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Serial + 














ee Serial Old 的 收集 器 组 合 进行 内 存 回收 
UseParNewGC 打开 此 开关 后 ， 使 用 ParNew + Serial Old 的 收集 器 组 合 进行 内 存 回 收 
打开 此 开关 后 ， 使 用 ParNew + CMS + Serial Old 的 收集 器 组 合 进行 内 存 

UseConcMarkSweepGC 回收 。Serial O1d 收集 器 将 作为 CMS 收集 器 出 现 Concurrent Mode Failure 
失败 后 的 后 备 收集 器 使 用 

UseParallelGC 虚拟 机 运行 在 Server 模式 下 的 默认 值 ， JE 使 用 Parallel 
Scavenge + Serial Old (PS MarkSweep) 的 收集 器 组 合 进 行 内存 回收 

LjseparallelOldGG 。 打开 此 开关 后 ， 使 用 Parallel Scavenge + Parallel O1d 的 收集 器 组 合 进行 
内 存 回 收 

SurvivorRatio 新 生 代 中 Eden 区域 与 Survivor 区 域 的 容量 比值 ， 默 认为 8， 代 表 


Eden : Survivor=8 : 1 


直接 晋升 到 老年 代 的 对 象 大 小 ， 设 置 这 个 参数 后 ， 大 于 这 个 参数 的 对 旬 
将 直接 在 老年 代 分 配 


晋升 到 老年 代 的 对 象 年 龄 。 每 个 对 象 在 坚持 过 一 次 Minor GC 之 后 ， 年 
龄 就 加 1， 当 超过 这 个 参数 值 时 就 进入 老年 代 


UseAdaptiveSizePolicy 动态 调整 Java 堆 中 各 个 区 域 的 大 小 以 及 进入 老年 代 的 年 龄 


是 否 允 许 分 配 担保 失败 ， 即 老年 代 的 剩余 空间 不 足以 应 付 新 生 代 的 整个 
Eden 和 Survivor 区 的 所 有 对 象 都 存活 的 极端 情况 


ParallelGCThreads 设置 并 行 GC 时 进行 内 存 回 收 的 线程 数 


GC 时 间 占 总 时 间 的 比率 ， 默 认 值 为 99， 即 允许 1% 的 GC 时 间 。 仅 在 
使 用 Parallel Scavenge 收集 器 时 生效 


MaxGCPauseMillis 设置 GC 的 最 大 停顿 时 间 。 仅 在 使 用 Parallel Scavenge 收集 器 时 生效 


设置 CMS 收集 器 在 老年 代 空间 被 使 用 多 少 后 触发 垃圾 收集 。 默 认 值 为 
68%， 仅 在 使 用 CMS 收集 器 时 生效 


设置 CMS 收集 器 在 完成 垃圾 收集 后 是 否 要 进行 一 次 内 存 雁 片 整理 。 仅 
在 使 用 CMS 收集 器 时 生效 


设置 CMS 收集 器 在 进行 若干 次 垃圾 收集 后 再 启动 一 次 内 存 碎 片 整理 。 
仅 在 使 用 CMS 收集 器 时 生效 


PretenureSizeThreshold 


MaxTenuringThreshold 


HandlePromotionFailure 











GCTimeRatio 


CMSInitiatingOccupancyFraction 


UseCMSCompactAtFullCollection 


CMSFullGCsBeforeCompaction 


四 图 片 来 源 : http://blogs.sun.com/jonthecollector/entry/our_collectors。 
D] 原因 Parallel Scavenge 收 集 器 及 后 面 提 到 的 G1 收集 器 都 没有 使 用 传统 的 GC 收集 器 代码 框架 ， 而 另外 独立 实现 ， 其 余 集 中 收集 器 则 共用 了 部 分 的 框架 代码 ， 详 细 可 参考 : http://blogs.sun.com/jonthecollector/ 
[3] 官方 介绍 : http://download.oracle.com/javase/1.5.0/docs/guide/vm/gc-ergonomics.html。 

团 需要 说 明 一 下 ，Parallel Scavenge 收集 器 架构 中 本 身 有 PS MarkSweep 收集 器 来 进行 老年 代 收 集 ， 并 没有 直接 使 用 Serial Old 收集 器 ， 但 是 这 个 PSMarkSweep 收集 器 是 以 Serial Old 收集 器 为 模板 设计 的 ， 与 
Serial Old 的 实现 非常 接近 ， 所 以 在 官方 的 许多 资料 中 都 是 直接 用 Serial Old 替代 PS MarkSweep 进行 讲解 ， 本 书 也 采用 此 说 法 。 

[5] G1 收集 器 最 早 在 2004 年 的 一 篇 论文 中 被 提出 ， 请 参考 : http://labs.oracle.com/jtech/pubs/04-gl-paperismm.pdf。 


3.5 ”内 存 分 配 与 回收 策略 

















Java 技 术 体系 中 所 提倡 的 自动 内 存 管理 最 终 可 以 归结 为 自动 化 地 解决 了 两 个 问题 : 给 对 象 分 配 内 存 以 及 回收 分 配给 对 象 的 内 存 。 关 于 回收 内 存 这 一 点 ， 我 们 已 经 使 用 了 大 量 的 篇 幅 去 介绍 虚拟 机 中 的 垃 
圾 收集 器 体系 及 其 运作 原理 ， 现 在 我 们 再 一 起 来 探讨 一 下 给 对 象 分 配 内 存 的 那 点 事 儿 。 

















对 象 的 内 存 分 配 ， 往 大 方向 上 讲 ， 就 是 在 堆 上 分 配 (但 也 可 能 经 过 JIT 编 译 后 被 拆散 为 标量 类 型 并 间接 地 在 栈 上 分 配 趾 ) ， 对 象 主要 分 配 在 新 生 代 的 Eden 区 上 ， 如 果 启动 了 本 地 线程 分 配 缓冲 ， 将 按 线程 
优先 在 TLAB 上 分 配 。 少 数 情况 下 也 可 能 会 直接 分 配 在 老年 代 中 ， 分 配 的 规则 并 不 是 百分之百 固定 的 ， 其 细节 取决 于 当前 使 用 的 是 哪 一 种 垃圾 收集 器 组 合 ， 还 有 虚拟 机 中 与 内 存 相 关 的 参数 的 设置 。 





















































接 下 来 我 们 将 会 讲解 几 条 最 普遍 的 内 存 分 配 规 则 ， 并 通过 代码 去 验证 这 些 规则 。 本 节 中 的 代码 在 测试 时 使 用 Client 模 式 虚 拟 机 运行 ， 没 有 手工 指定 收集 器 组 合 ， 换 句 话说 ， 验 证 的 是 使 用 Serial/Serial 
Old 收集 器 下 (ParNew/Serial Old 收集 器 组 合 的 规则 也 基本 一 致 ) 的 内 存 分 配 和 回收 的 策略 。 读 者 不 妨 根据 自己 项 目 中 使 用 的 收集 器 写 一 些 程序 去 验证 一 下 使 用 其 他 几 种 收集 器 的 内 存 分 配 策略 。 




















3.5.1 ”对 象 优 先 在 Eden 分 配 


大 多 数 情况 下 ， 对 象 在 新 生 代 Eden 区 中 分 配 。 当 Eden 区 没有 足够 的 空间 进行 分 配 时 ， 虚 拟 机 将 发 起 一 次 Minor GC。 








志 一 般 是 打印 到 文件 后 通过 日 志 工具 进行 分 析 ， 不 过 本 实验 的 日 志 并 不 多 ， 直 接 阅读 就 能 看 得 和 


虚拟 机 提供 了 -XX: +PrintGCDetails 这 个 收集 器 日 志 参 数 ， 告 诉 虚 拟 机 在 发 生 垃圾 收集 行为 时 打印 内 存 回 收 日 志 ， 并 且 在 进程 退出 的 时 候 输 出 当前 内 存 各 区 域 的 分 配 情况 。 在 实际 应 用 中 ， 内 存 回收 日 


代码 清单 3-3 的 testAllocation0 方 法 中 ， 尝 试 分 配 3 个 2MB 大 小 和 1 个 4MB 大 小 的 对 象 ， 在 运行 时 通过 -Xms20M、-Xmx20M 和 -Xmn10M 这 3 个 参数 限制 Java 堆 大 小 为 20MB， 且 不 可 扩展 ， 














: 甫 林 
/月 人 E。 


























中 10MB 





分 配给 新 生 代 ， 剩 下 的 10MB 分 配给 老年 代 。-XX: SurvivorRatio=8 决 定 了 新 生 代 中 Eden 区 与 一 个 Survivor 区 的 空间 比例 是 8 比 1， 从 输出 的 结果 也 能 清晰 地 看 到 “eden space 8192K、from space 


1024K、to space 1024K” 的 信息 ， 新 生 代 总 可 | 


执行 testAllocation() 中 分 配 allocation4 对 象 
的 ， 庶 拟 机 几 和 





F 没 有 找到 可 回收 的 对 象 ) 。 这 次 GC 发 生 的 原因 是 给 a 


























汐 语句 时 会 发 生 一 次 Minor GC， 这 次 GC 的 结果 是 新 生 代 6651KB 变 为 148KB， 而 总 内 存 占 
location4 分 配 内 存 的 时 候 ， 发 现 Eden 已 经 被 占 





空间 为 9216KB (Eden 区 +1 个 Survivor 区 的 总 容量 ) 。 























量 则 几乎 没有 减少 (因为 allocation1、2、3 三 个 对 象 都 是 存活 
了 6MB， 剩 余 空 间 已 不 足以 分 配 allocation4 所 需 的 4MB 内 存 ， 因 此 发 生 Minor GC。 
































GC 期 间 虚 拟 机 又 发 现 已 有 的 3 个 2MB 大 小 的 对 象 全 部 无 法 放 入 Survivor 空 间 (Survivor 空 间 只 有 1MB 大 小 ) ， 所 以 只 好 通过 分 配 担 保 机 制 提前 转移 到 老年 代 去 。 


这 次 GC 结束 后 ，4MB 的 allocation4 对 象 被 顺利 分 配 在 Eden 中 。 


过 GC 日 志 可 以 证 实 这 一 点 。 








因 








注意 作者 多 次 提 到 的 Minor GC 和 Full GC 有 什么 不 一 样 吗 ? 


"新生 代 GC (Minor GC) 


此 程序 执行 完 的 结果 是 Eden 占 


























4MB (被 allocation4 占 . 











) ，Survivor 空 闲 ， 老 年 代 被 占用 6MB (被 allocation1、2、3 占 

















: 指 发 生 在 新 生 代 的 垃圾 收集 动作 ， 因 为 Java 对 象 大 多 都 具备 朝 生 夕 灭 的 特性 ， 所 以 Minor GC 非 常 频繁 ， 一 般 回收 速度 也 比较 快 。 


“ 老年 代 GC (Major GC/Full GC) : 指 发 生 在 老年 代 的 GC， 出 现 了 Major GC， 经 常会 伴随 至 少 一 次 的 Minor GC (但 非 绝 对 的 ， 在 ParallelScavenge 收 集 器 的 收集 策略 里 就 有 直接 进行 Major GC 的 策略 选择 过 


程 ) 。MajorGC 的 速度 一 般 会 比 Minor GC 慢 10 倍 以 上 。 


代码 清单 3-3 新生 代 Minor GC 


Private static final 





int _1MB = 1024 * 1024; 


* VM 参 数 : -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:SurvivorRatio=8 


uf 


Public static void testAllocation() { 


byte[] allocationl, 


allocation2, allocation3, allocation4; 





allocatijonl = new byte[2 * 1MB]; 

allocation2 = new byte[2 * _1MB]; 

allocation3 = new byte[2 * _1MB]; 

allocation4 = new byte[4 * _1MB]; // 出 现 一 次 Minor GC 
} 

运行 结果 





[GC [DefNew: 6651K->148K(9216K), 0.0070106 secs] 6651K->6292K(19456K), 0.0070426 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 


Heap 

def new generation 
eden space 8192K, 
from space 1024K, 
to space 1024K, 

tenured generation 
the space 10240K, 

compacting perm gen 
the space 12288K, 


total 9216K, used 4326K [0x02990000, 0x033d0000,，，0x03340000) 
51% used [0x02990000, 0x02de4828, 0x03190000) 

14% used [0x032dq0000，0x032f5370，0x033d0000) 

0% used [0x03190000, 0x031d0000, 0x03240000) 

total 10240K, used 6144K [0x033d0000, 0x03dd0000, 0x03dq0000) 
60% used [0x033dq0000，0x039d0030，0x039dq0200，0x03dd0000) 
total 12288K, used 2114K [0x039d90000, 0x049d0000, 0x07dd0000) 
17% used [0x03990000, 0x03fe0998, 0x03fe0a00, 0x04990000) 


No shared spaces configured. 








3.5.2 ”大 对 象 直接 进入 老年 代 


所 谓 大 对 象 就 是 指 ， 需 要 大 量 连 续 内 存 空 间 的 Java 对 象 ， 最 典型 的 大 对 象 就 是 那 种 很 长 的 字符 
息 ( 蔡 Java 虚 拟 机 抱怨 一 句 ， 比 遇 到 一 个 大 对 象 更 加 坏 的 消息 就 是 遇 到 一 群 “ 朝 生 夕 灭 " 的 


以 获取 足够 的 连续 空间 来 “安置 ”它们 。 


虚拟 机 提供 了 一 个 -XX: 

















复制 算法 收集 内 存 ) 。 


执行 代码 清单 3-4 中 的 testPretenureSizeThreshold() 方 法 后 ， 我 们 看 到 Eden 空 间 几 乎 没有 被 使 
为 PretenureSizeThreshold 被 设置 为 3MB (就 是 3145728B， 这 个 参数 不 能 与 -Xmx 之 类 的 参数 一 样 直接 写 3MB) ， 





及 数组 〈 笔 者 例子 中 的 byte[ 数 组 就 是 典型 的 大 对 象 ) 。 大 对 象 对 虚拟 机 的 内 存 分 配 来 说 就 是 一 个 坏 消 


“短命 大 对 象 ” ， 写 程序 的 时 候 应 当 避 免 ) ， 经 常 出 现 大 对 象 容易 导致 内 存 还 有 不 少 空间 时 就 提前 触发 垃圾 收集 








PretenureSizeThreshold 参 数 ， 令 大 了 





这 个 设置 值 的 对 象 直接 在 老 























代 中 分 配 。 这 样 做 的 











的 是 避免 在 Eden 








区 及 两 个 Survivor 区 之 间 发 生 大量 的 内 存 拷贝 (复习 一 下 : 新 生 代 























， 而 老年 代 10MB 





的 空间 被 使 用 了 40%， 也 就 是 4MB 的 allocation 对 象 直接 就 分 配 在 老年 代 中 ， 这 是 因 
因此 超过 3MB 的 对 象 都 会 直接 在 老年 代 中 进行 分 配 。 





























注意 ”PretenureSizeThreshold 参 数 只 对 Serial 和 ParNew 两 款 收集 器 有 效 ，Parallel Scavenge 收 集 器 不 认识 这 个 参数 ，Parallel Scavenge 收 集 器 一 般 并 不 需要 设置 。 如 果 遇 到 必须 使 用 此 参数 的 场合 ， 可 以 考虑 
ParNew 加 CMS 的 收集 器 组 合 。 


代码 清单 3-4 ”大 对 象 直接 进入 老年 代 








private static final 


/x** 


int _1MB = 1024 * 1024; 


* VM 参数 : -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:SurvivorRatio=8 
* —XX:PretenureSizeThreshold=3145728 


«yf 


public static void testPretenureSizeThreshold() { 


byte[] allocation; 


allocation = new byte[4 * 


_1MB] ; ”// 直 接 分 配 在 老年 代 中 








Heap 

def new generation 
eden space 8192K, 
from space 1024K, 
to space 1024K, 

tenured generation 
the space 10240K, 

compacting perm gen 
the space 12288K, 


total 9216K, used 671K [0x029d0000，0x033d0000，0x033d0000) 
8% used [0x02990000, 0x02a77e98, 0x031d0000) 

0% used [0x03190000, 0x03190000, 0x032d0000) 

0% used [0x032d0000，0x032d0000，0x033d0000) 

total 10240K, used 4096K [0x033d0000, 0x03dd0000, 0x03dq0000) 
40% used [0x033d0000, 0x037d0010, 0x037d0200, 0x03990000) 
total 12288K, used 2107K [0x03990000, 0x049d0000, 0x07dd0000) 
17% used [0x03990000, 0x03fdefd0, 0x03fdf000, 0x04990000) 


No shared spaces configured. 


3.5.3 ”长 期 存活 的 对 象 将 进入 老年 代 








虚拟 机 既然 采 











了 分 代 收 集 的 思想 来 管理 内 存 ， 那 内 存 回 收 时 就 必须 能 识别 哪些 对 象 应 当 放 在 新 生 代 ， 哪 些 对 象 应 放 在 老年 代 中 。 为 了 做 到 这 点 ， 虚 拟 机 给 每 个 对 象 定义 了 一 个 对 象 年 龄 (Age) 计数 

















器 。 如 果 对 象 在 Eden 出 生 并 经 过 第 一 次 Minor GC 后 仍然 存活 ， 并 且 能 被 Survivor 容 纳 的 话 ， 将 被 移动 到 Survivor 空 间 中 ， 并 将 对 象 年 龄 设 为 1。 对 象 在 Survivor 区 中 每 熬 过 一 次 Minor GC， 年 龄 就 增加 1 
岁 ， 当 它 的 年 龄 增加 到 一 定 程度 (默认 为 15 岁 ) 时 ， 就 会 被 晋升 到 老年 代 中 。 对 象 晋升 老年 代 的 年 龄 阔 值 ， 可 以 通过 参数 -XX: MaxTenuringThreshold 来 设置 。 




















读者 可 以 试 试 分 别 以 -XX: MaxTenuringThreshold=1 和 -XX: MaxTenuringThreshold=15 两 种 设置 来 执行 代码 清单 3-5 中 的 testTenuringThreshold() 方 法 ， 此 方法 中 allocation1 对 象 需要 256KB 的 内 
存 空间 ，Survivor 空 间 可 以 容纳 。 当 MaxTenuringThreshold=1 时 ，allocation1 对 象 在 第 二 次 GC 发 生 时 进入 老年 代 ， 新 生 代 已 使 用 的 内 存 GC 后 会 非常 干净 地 变 成 OKB。 而 MaxTenuringThreshold=15 
时 ， 第 二 次 GC 发 生 后 ，allocation1 对 象 则 还 留 在 新 生 代 Survivor 空 间 ， 这 时 候 新 生 代 仍 然 有 404KB 的 空间 被 占用 。 





























代码 清单 3-5 ”长 期 存活 的 对 象 进入 老年 代 





private static final int _1MB = 1024 * 1024; 
/** 
* VM 参数 : -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=1 
* -XX:+PrintTenuringDistribution 
六 
天 
Q@SuppressWarnings ("unused") 
public static void testTenuringThreshold() { 
byte[] allocationl, allocation2, allocation3; 
allocationl = new byte[ 1MB / 4]; 
// 什么 时 候 进入 老年 代 取 决 于 XX:MaxTenuringThreshold 设 置 
allocation2 = new byte[4 * _1MB]; 
allocation3 new byte[4 * 1MB]; 
allocation3 = null; 
allocation3 = new byte[4 * _1MB]7 








以 MaxTenuringThreshold=1 的 参数 设置 来 运行 的 结果 : 





[GC [DefNew 

Desired Survivor size 524288 bytes, new threshold 1 (max 1) 

- age 1: 414664 bytes, 414664 total 

: 4859K->404K (9216K), 0.0065012 secs] 4859K->4500K(19456K), 0.0065283 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] 
[GC [DefNew 


Desired Survivor size 524288 bytes, new threshold 1 (max 1) 

: 4500K->0K(9216K), 0.0009253 secs] 8596K->4500K(19456K), 0.0009458 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 

Heap 

def new generation total 9216K, used 4178K [0x029d0000, 0x033d0000,，0x033d0000) 
eden space 8192K, 51% used [0x029d0000, 0x02de4828, 0x031d0000) 
from space 1024K, 0% used [0x031d0000，0x031dq0000，0x032dq0000) 
to space 1024K, 0% used [0x032d0000, 0x032d0000,，，0x033d0000) 

tenured generation total 10240K, used 4500K [0x033d0000, 0x03dd0000,，，0x03dd0000) 
the space 10240K, 43% used [0x033d0000, 0x03835348, 0x03835400, 0x03dq0000) 

compacting perm gen total 12288K, used 2114K [0x03dd0000, 0x049d0000, 0x07dd0000) 
the space 12288K, 17% used [0x03dd0000, 0x03fe0998, 0x03fe0a00, 0x049d0000) 

No shared spaces configured. 


以 MaxTenuringThreshold=15 的 参数 设置 来 运行 的 结果 : 





[GC [DefNew 

Desired Survivor size 524288 bytes, new threshold 15 (max 15) 

-~ age 1: 414664 bytes, 414664 total 

: 4859K->404K (9216K), 0.0049637 secs] 4859K->4500K(19456K), 0.0049932 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC [DefNew 

Desired Survivor size 524288 bytes, new threshold 15 (max 15) 

-age 2: 414520 bytes, 414520 total 

: 4500K->404K (9216K), 0.0008091 secs] 8596K->4500K(19456K), 0.0008305 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap 


def new generation 
eden space 8192K, 
from space 1024K, 
to space 1024K, 
tenured generation 

the space 10240K, 


total 9216K, used 4582K [0x02990000, 0x033d0000,，，0x03340000) 
51% used [0x02990000, 0x02de4828, 0x031d0000) 

39% used [0x0319d0000, 0x03235338, 0x032d0000) 

0% used [0x032d0000，0x032d0000，0x033dq0000) 

total 10240K, used 4096K [0x033d0000, 0x03dd0000, 0x03dq0000) 
40% used [0x033d0000, 0x037d0010, 0x037d0200, 0x03990000) 


compacting perm gen total 12288K, used 2114K [0x03dd0000, 0x049d0000, 0x07dd0000) 
the space 12288K, 17% used [0x03dd0000, 0x03fe0998, 0x03fe0a00, 0x049d0000) 
No shared spaces configured. 


3.5.4 ”动态 对 象 年 龄 判定 





FSurvivor 空 间 的 一 








为 了 能 更 好 地 适应 不 同 程序 的 内 存 状 况 ， 虚 拟 机 并 不 总 是 要 求 对 象 的 年 龄 必须 达到 MaxTenuringThreshold 才 能 晋升 老年 代 ， 如 果 在 Survivor 空 间 中 相同 年 龄 所 有 对 象 大 小 的 总 和 大 了 
年 龄 大 于 或 等 于 该 年 龄 的 对 象 就 可 以 直接 进入 老年 代 ， 无 须 等 到 MaxTenuringThreshold 中 要 求 的 生 









































执行 代码 清单 3-6 中 的 testTenuringThreshold2() 方 法 ， 并 设置 参数 -XX: MaxTenuringThreshold=15， 会 发 现 运行 结果 中 Survivor 的 空间 占用 仍然 为 0%， 而 老年 代 比 预期 增加 了 6%， 也 就 是 说 
allocation1、allocation2 对 象 都 直接 进入 了 老年 代 ， 而 没有 等 到 15 岁 的 临界 年 龄 。 因 为 这 两 个 对 象 加 起 来 已 经 达到 了 512KB， 并 且 它 们 是 同年 的 ， 满 足 同年 对 象 达到 Survivor 空 间 的 一 半 规 则 。 我 们 只 要 注 
释 掉 其 中 一 个 对 象 的 new 操 作 ， 就 会 发 现 另 外 一 个 不 会 晋升 到 老年 代 中 去 了 。 






































代码 清单 3-6 ”动态 对 象 年 龄 判定 


private static final int 1MB = 1024 * 1024; 
4 
* VM 参 数 : -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=15 
* -XX:+PrintTenuringDistribution 
/ 
@SuppressWarnings ("unused") 
public static void testTenuringThreshold2() { 
byte[] allocationl, allocation2, allocation3, allocation4; 
allocationl = new byte[_1MB / 4]; 
// allocation1+allocation2 大 于 survivor 空 间 的 一 半 
allocation2 = new byte[_ 1MB / 4]; 
allocation3 = new byte[4 * _1MB]; 
allocation4 new byte[4 * _1MB]; 








allocation4 = null; 
allocation4 = new byte[4 * 1MB]; 
} 
运行 结果 
[GC [DefNew 
Desired Survivor size 524288 bytes, new threshold 1 (max 15) 
-Be 1: 676824 bytes, 676824 total 
: 5115K->660K (9216K), 0.0050136 secs] 5115K->4756K(19456K), 0.0050443 secs] [Times: user=0.00 sys=0.01, real=0.01 secs] 
[GC [DefNew 


Desired Survivor size 524288 bytes, new threshold 15 (max 15) 
: 4756K->0K (9216K), 0.0010571 secs] 8852K->4756K(19456K), 0.0011009 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heal 
Gr new generation total 9216K, used 4178K [0x029d0000, 0x033d0000,，0x033d0000) 
eden space 8192K, 51% used [0x029d0000, 0x02de4828, 0x031d0000) 
from space 1024K, 当 used [0x031dq0000，0x031dq0000，0x032d0000) 
to space 1024K, 0% used [0x032d0000, 0x032d0000,，，0x033d0000) 
tenured generation total 10240K, used 4756K [0x033d0000, 0x03dd0000, 0x03dd0000) 


the space 10240K, 46% used [0x033dq0000，0x038753e8，0x03875400，0x03dd0000) 
compacting perm gen total 12288K, used 2114K [0x03dd0000, 0x049d0000, 0x07dd0000) 
the space 12288K, 17% used [0x03dd0000, 0x03fe09a0, 0x03fe0a00, 0x049d0000) 
No shared spaces configured. 





3.5.5 ”空间 分 配 担 保 











在 发 生 Minor GC 时 ， 虚 拟 机 会 检测 之 前 每 次 晋升 到 老年 代 的 平均 大 小 是 否 大 于 老年 代 的 剩余 空间 大 小 ， 如 果 大 于 ， 则 改 为 直接 进行 一 次 Full GC。 如 果 小 于 ， 则 查看 HandlePromotionFailure 设 置 是 
否 允 许 担 保 失败 ;如果 允许 ， 那 只 会 进行 Minor GC; 如 果 不 允 许 ， 则 也 要 改 为 进行 一 次 Full GC。 





















































和 面 提 到 过 ， 新 生 代 使 用 复制 收集 算法 ， 但 为 了 内 存 利用 率 ， 只 使 用 其 中 一 个 Survivor 空 间 来 作为 轮换 备份 ， 因 此 当 出 现 大 量 对 象 在 Minor GC 后 仍然 存活 的 情况 时 (最 极端 就 是 内 存 回 收 后 新 生 代 中 所 
有 对 象 都 存活 ) ， 就 需要 老年 代 进行 分 配 担保 ， 让 Survivor 无 法 容纳 的 对 象 直接 进入 老年 代 。 与 生活 中 的 贷款 担保 类 似 ， 老 年 代 要 进行 这 样 的 担保 ， 前 提 是 老年 代 本 身 还 有 容纳 这 些 对 象 的 剩余 空间 ， 一 共 
有 多 少 对 象 会 活 下 来 ， 在 实际 完成 内 存 回收 之 前 是 无 法 明确 知道 的 ， 所 以 只 好 取 之 前 每 一 次 回收 晋升 到 老年 代 对 象 容量 的 平均 大 小 值 作 为 经 验 值 ， 与 老年 代 的 剩余 空间 进行 比较 ， 决 定 是 否 进行 Full GC 来 让 
老年 代 腾 出 更 多 空间 。 
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取 平 均值 进行 比较 其 实 仍然 是 一 种 动态 概率 的 手段 ， 也 就 是 说 如 果 某 次 Minor GC 存活 后 的 对 象 突 增 ， 远 远 高 于 平均 值 的 话 ， 依 然 会 导致 担保 失败 (Handle Promotion Failure) 。 如 果 出 现 了 
HandlePromotionFailure 失 败 ， 那 就 只 好 在 失败 后 重新 发 起 一 次 Full GC。 昌 然 担 保 失败 时 绕 的 圈子 是 最 大 的 ， 但 大 部 分 情况 下 都 还 是 会 将 HandlePromotionFailure 开 关 打开 ,避免 Full GC 过 于 频繁 ， 参 
见 代码 清单 3-7。 














代码 清单 3-7 ”空间 分 配 担保 





private static final int 1MB = 1024 * 1024; 

/** 

* VM 参数 : -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:SurvivorRatio=8 -XX:- 
HandlePromotionFailure 


@SuppressWarnings ("unused") 

public static void testHandlePromotion() { 
byte[] allocationl, allocation2, allocation3, allocation4, allocation5, allocation6, allocation7; 
allocationl = new byte[2 * 1MB]; 


allocation2 = new byte[2 * _1MB]; 
allocation3 = new byte[2 * 1MB]; 
allocation1l = null; 
allocation4 = new byte[2 * 1MB]; 
allocation5 = new byte[2 * 1MB]; 
allocation6 = new byte[2 * “1MB]; 
allocation4 = null; 

allocation5 = null; 

allocation6 = null 


allocation7 = new byte[2 * 1MB]; 





以 HandlePromotionFailure=false 的 参数 设置 来 运行 的 结果 : 





GC [DefNew: 6651K->148K(9216K), 0.0078936 secs] 6651K->4244K(19456K), 0.0079192 secs] [Times: user=0.00 sys=0.02, real=0.02 secs] 
GC [DefNew: 6378K->6378K(9216K), 0.0000206 secs] [Tenured: 4096K->4244K(10240K), 0.0042901 secs] 10474K->4244K(19456K), [Perm : 2104K->2104K(12288K)], 0.0043613 secs] [Times: t 





以 MaxTenuringThreshold=true 的 参数 设置 来 运行 的 结果 : 





GC [DefNew: 6651K->148K(9216K), 0.0054913 secs] 6651K->4244K(19456K), 0.0055327 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
GC [DefNew: 6378K->148K(9216K), 0.0006584 secs] 10474K->4244K(19456K), 0.0006857 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 





[由 JIT 即 时 编译 器 相关 优化 可 参见 第 11 章 。 


3.6 本章 小 结 








本 章 介绍 了 垃圾 收集 的 算法 、 几 款 JDK 1.6 中 提供 的 垃圾 收集 器 特点 及 其 运作 原理 。 通 过 代码 实例 验证 了 Java 虚 拟 机 中 自动 内 存 分 配 及 回收 的 主要 规则 。 


























内 存 回收 与 垃圾 收集 器 在 很 多 时 候 都 是 影响 系统 性 能 、 并 发 能 力 的 主要 因素 之 一 ， 虚 拟 机 之 所 以 提供 多 种 不 同 的 收集 器 及 大 量 的 调节 参数 ， 是 因为 只 有 根据 实际 应 用 需求 、 实 现 方式 选择 最 优 的 收集 方 
式 才 能 获取 最 好 的 性 能 。 没 有 固定 收集 器 、 参 数组 合 ， 也 没有 最 优 的 调 优 方法 ， 虚 拟 机 也 没有 什么 必然 的 内 存 回收 行为 。 因 此 学 习 虚 拟 机 内 存 知识 ， 如 果 要 到 实践 调 优 阶段 ， 必 须 了 解 每 个 具体 收集 器 的 行 
为 、 优 势 和 劣势 、 调 节 参 数 。 在 接 下 来 的 两 章 中 ， 作 者 将 会 介绍 内 存 分 析 的 工具 和 调 优 的 一 些 具体 案例 。 















































第 4 章 ”虚拟 机 性 能 监控 与 故障 处 理工 具 





本 章 主要 内 容 
“ 概述 
“ JDK 的 命令 行 工具 


“ JDK 的 可 视 化 工具 








Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 的 高 墙 ， 墙 外 面 的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 























4.1 概述 








经 过 前 面 两 章 对 于 虚拟 机 内 存 分 配 与 回收 技术 各 方面 的 介绍 ， 相 信 读 者 已 经 建立 了 一 个 比较 完整 的 理论 基础 。 理 论 总 是 作为 指导 实践 的 工具 ， 能 把 这 些 知 识 投入 到 实际 工作 中 才 是 我 们 的 最 终 目的 。 接 
下 来 的 两 章 ， 我 们 将 从 实践 的 角度 去 了 解 虚拟 机 内 存 管理 的 世界 。 
































给 一 个 系统 定位 问题 的 时 候 ， 知 识 、 经 验 是 关键 基础 ， 数 据 是 依据 ， 工 具 是 运用 知识 处 理 数据 的 手段 。 这 里 说 的 数据 包括 : 运行 日 志 、 异 常 堆栈 、GC 日 志 、 线 程 快照 (threaddump/javacore 文 









































件 ) 、 堆 转 储 快照 (heapdump/hprof 文 件 ) 等 。 经 常 使 
层 包装 ， 没 有 什么 工具 是 “秘密 武器 ”， 











适当 的 虚拟 机 监控 和 分 析 的 工 
学 会 了 就 能 包 治 百 病 。 














可 以 加 快 我 们 分 析 数 据 和 定位 解决 问题 的 速度 ， 但 我 们 在 学 习 工 














前 ， 也 应 当 意 识 到 工具 永远 都 是 知识 技能 的 一 




















4.2 ” JDK 的 命令 行 工具 

















Java 开 发 人 员 肯 定 都 知道 JDK 的 bin 目 录 中 有 “java.exe” 和 “javac.exe” 这 两 个 命令 行 工 
下 命令 行 工 具 的 数量 和 功能 总 会 不 知 不 觉 地 增加 和 增强 ，bin 目 录 的 内 容 如 图 4-1 所 示 。 








， 但 并 非 所 有 程序 员 都 了 解 过 JDK 的 bin 目 录 之 中 其 他 命令 行程 序 的 作用 。 每 着 JDK 更 新 版 本 之 时 ，bin 目 录 














Documents (D:) » _DevSpace » jdk1.6.0 21 ”bin 


a | 


共享 :v 新 建文 件 夫 








名 称 修改 日 期 类 型 大 小 

a xjc.exe 2010/7/19 11:56 ”应 用 程序 27 KB 
a wsimport.exe 2010/7/19 11:56 ”应 用 程序 27 KB 
EE] wsgen.exe 2010/7/19 11:56 ”应用 程序 27 KB 
lg" unpack200.exe 2010/7/19 11:56 应 用 程序 124 KB 
| tnameserv.exe 2010/7/19 11:56 ”应 用 程序 27 KB 
a servertool.exe 2010/7/19 11:56 ”应 用 程序 27 KB 
| serialver.exe 2010/7/19 11:56 应 用 程序 27 KB 
四 引 schemagen.exe 2010/7/19 11:56 应 用 程序 27 KB 
a | rmiregistry.exe 2010/7/19 11:56 应 用 程序 27 KB 
[a | rmid.exe 2010/7/19 11:56 ”应用 程序 27 KB 
[| rmic.exe 2010/7/19 11:56 ”应 用 程序 27 KB 
a policytool.exe 2010/7/19 11:56 ”应 用 程序 27 KB 
[S| packager.exe 2010/7/19 11:56 应 用 程序 72 KB 


图 4-1 ”Sun JDK 中 的 工具 目录 








在 本 章 中 ， 笔 者 将 介绍 这 些 工具 的 其 中 一 部 分 ， 主 要 是 用 于 监视 虚拟 机 和 故障 处 理 的 工具 。 这 些 故 障 处 理工 具 被 Sun 公 司 作 为 “礼物 ” 附 赠 给 JDK 的 使 用 者 ， 在 软件 的 使 用 说 明 中 把 它们 声明 为 “没有 技 
术 支 持 并 且 是 实验 性 质 的 。 (unsupported and experimental) 【|] 的 产品 ， 但 事实 上 这 些 工具 都 非常 稳定 而 且 功 能 强大 ， 能 在 处 理应 用 程序 性 能 问题 、 定 位 故障 时 发 挥 很 大 的 作用 。 















































说 起 JDK 的 工具 ， 读 者 如 果 比 较 细心 的 话 ， 可 能 会 注意 到 这 些 工具 的 程序 体积 都 异常 的 小 。 假 如 以 前 没 注意 到 ， 现 在 不 妨 再 看 看 图 4-1 中 的 最 后 一 列 “ 大 小 ”， 各 个 工具 的 体积 基本 上 都 稳定 在 27KB 左 
右 。 并 非 JDK 开 发 团队 刻意 把 它们 制作 得 如 此 精炼 来 炫耀 编程 水 平 ， 而 是 因为 这 些 命令 行 工具 大 多 数 是 jdkNlib\toolsjar 类 库 的 一 层 落 包 装 而 已 ， 它 们 主要 的 功能 代码 是 在 tools 类 库 中 实现 的 。 读 者 把 图 4-1 
和 图 4-2 两 张 图片 对 比 一 下 就 可 以 看 得 很 清楚 。 









































假如 读者 使 用 的 是 Linux 版 本 的 JDK， 还 会 发 现 这 些 工 





中 很 多 甚至 就 是 由 Shell 脚 本 直接 写成 的 ， 可 以 用 vi 











m 直 接 打 开 它 们 。 






































JDK 开 发 团队 选择 采用 Java 代 码 来 实现 这 些 监控 工具 是 有 特别 用 意 的: 当 应 用 程序 部 署 到 生产 环境 后 ， 无 论 是 直接 接触 物理 服务 器 还 是 远程 Telnet 到 服务 器 上 都 可 能 会 受到 限制 。 借 助 toolsjar 类 库 里 面 
的 接口 ， 我 们 可 以 直接 在 应 用 程序 中 实现 功能 强大 的 监控 分 析 功 能 外 ]。 














国 N= tools. jar\sun\tools - ZIP 卜 缩 文件 ， 解 包 大 小 汶 11, 923,2 


' Folder 2010/9/15 
| attach Folder 2010/9/15 

hprof Folder 2010/9/15 

jar Folder 2010/9/15 
,java Folder 2010/9/15 
,javac Folder 2010/9/15 
| javap Folder 2010/9/15 


,jinfo Folder 2010/9/15 

jmap Folder 2010/9/15 
) jps Folder 2010/9/15 
jstack Folder 2010/9/15 
) jstat Folder 2010/9/15 
,jstatd Folder 2010/9/15 

nativeZascil Folder 2010/9/15 


serialver Folder 2010/9/15 
) tree Folder 2010/9/15 
jutil Folder 2010/9/15 














4-2 tools.jar 包 的 内 部 状况 














需要 特别 说 明 的 是 ， 本 章 介绍 的 工具 全 部 基于 Windows 平 台 下 的 JDK 1.6Update 21， 如 果 JDK 版 本 、 操 作 系统 不 同 ， 工 具 所 支持 的 功能 可 能 会 有 较 大 差别 。 大 部 分 工具 在 JDK 1.5 中 就 已 经 提供 ， 但 为 
了 避免 运行 环境 带 来 的 差异 和 兼容 性 问题 ， 建 议 读 者 使 用 IDK 1.6 来 验证 本 章 介 绍 的 内 容 ， 因 为 JDK 1.6 的 工具 可 以 正常 兼容 运行 于 JDK 1.5 的 虚拟 机 之 上 的 程序 ， 反 之 则 不 一 定 。 表 4-1 中 列举 了 JDK 主 要 命令 
行 监控 工具 的 用 途 。 





























注意 ”如 果 读 者 在 工作 中 需要 监控 运行 于 JDK 1.5 的 虚拟 机 之 上 的 程序 ， 在 程序 启动 时 请 添加 参数 “-Dcom.sun.management.jmxremote” 开 启 JMX 管 理 功能 ， 否 则 由 于 部 分 工具 都 是 基于 JMX 的 (包括 下 一 
节 的 可 视 化 工具 ) ， 因 此 它们 都 将 会 无 法 使 用 ， 如 果 被 监控 程序 运行 于 JDK 1.6 的 虚拟 机 之 上 ， 那 JMX 管 理 默认 是 开启 的 ， 虚 拟 机 启动 时 无 须 再 添加 任何 参数 。 


表 4-1 Sun JDK 监 挖 和 故障 处 理工 具 








名 称 主要 作用 

jps JVM Process Status Tool， 显 示 指 定 系 统 内 所 有 的 HotSpot 虚拟 机 进程 

jstat JVM Statistics Monitoring Tool， 用 于 收集 HotSpot 虚拟 机 各 方面 的 运行 数据 

jinfo Configuration Info for Java， 显 示 虚 拟 机 配置 信息 

jmap Memory Map for Java， 生 成 虚拟 机 的 内 存 转 储 快照 (heapdumop 文件 ) 

jhat JVM Heap Dump Browser， 用 于 分 析 heapdumop 文件 ， 它 会 建立 一 个 HTTP/HTML 
服务 器 ， 让 用 户 可 以 在 浏览 器 上 查看 分 析 结 果 

jstack Stack Trace for Java， 显 示 虚 拟 机 的 线程 快照 


4.2.1 jps: 虚拟 机 进程 状况 工具 








JDK 的 很 多 小 工具 的 名 字 都 参考 了 Unix 命 令 的 命名 方式 ，jps (JVM Process Status Tool) 是 其 中 的 典型 。 除 了 名 字 像 Unix 的 ps 命令 之 外 ， 它 的 功能 也 和 ps 命令 类 似 : 可 以 列 出 正在 运行 的 虚拟 机 进 
程 ， 并 显示 虚拟 机 执行 主 类 (Main Class，main() 函 数 所 在 的 类 ) 的 名 称 ， 以 及 这 些 进程 的 本 地 虚拟 机 的 唯一 ID (LVMID，Local Virtual Machine ldentifier) 。 虽 然 功能 比较 单一 ， 但 它 是 使 用 频率 最 高 
的 JDK 命 令 行 工 具 ， 因 为 其 他 的 JDK 工 具 大 多 须要 输入 它 查询 到 的 LVMID 来 确定 要 监控 的 是 哪 一 个 虚拟 机 进程 。 对 于 本 地 虚拟 机 进程 来 说 ，LVMID 与 操作 系统 的 进程 ID (PID，Process Identifier) 是 一 致 



























































的 ， 使 用 Windows 的 任务 管理 器 或 Unix 的 ps 命令 也 可 以 查询 到 虚拟 机 进程 的 LVMID， 但 如 果 同 时 启动 了 多 个 虚拟 机 进程 ， 无 法 根据 进程 名 称 定位 时 ， 那 就 只 能 依赖 jps 命 令 显示 主 类 的 功能 才能 区 分 了 。 








jps 命 令 格 式 : 





jps [ options ] [ hostid ] 





jps 执 行 样 例 : 





D:\Develop\Java\jdk1.6.0 21\bin>jps -1 

2388 D:\Develop\glassfish\bin\http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/..\modules\admin-cli.jar 
2764 com.sun.enterprise.glassfish.bootstrap.ASMain 

3788 sun.tools.jps.Jps 














jps 可 以 通过 RMI 协 议 查询 开启 了 RMI 服 务 的 远程 虚拟 机 进程 状态 ，hostid 为 RMI 注 册 表 中 注册 的 主机 名 。jps 的 其 他 常用 选项 见 表 4-2。 

















表 4-2 jps 工 具 主要 选项 


选项 作 用 

-dq 只 输出 LVMID， 省 略 主 类 的 名 称 

输出 虚拟 机 进程 启动 时 传递 给 主 类 main() 函数 的 参数 
输出 主 类 的 全 名 ， 如 果 进 程 执行 的 是 Jar 包 ， 输 出 Jar 路 径 
ay 输出 虚拟 机 进程 启动 时 JVM 参数 


4.2.2 jstat: 虚拟 机 统计 信息 监视 工具 











jstat UVM Statistics Monitoring Tool) 是 用 于 监视 虚拟 机 各 种 运行 状态 信息 的 命令 行 工具 。 它 可 以 显示 本 地 或 远程 虚拟 机 进程 中 的 类 装载 、 内 存 、 垃 圾 收集 、JIT 编 译 等 运行 数据 ， 在 没有 GUI 图 形 
界面 ， 只 提供 了 纯 文 本 控制 台 环境 的 服务 器 上 ， 它 将 是 运行 期 定位 虚拟 机 性 能 问题 的 首选 工具 。 














jstat 命 令 格式 为 : 





jstat [ option vmid [interval[slIms] [count]] ] 





对 于 命令 格式 中 的 VMID 与 LVMID 需 要 特别 说 明 一 下 : 如 果 是 本 地 虚拟 机 进程 ，VMID 与 LVMID 是 一 致 的 ， 如 果 是 远程 虚拟 机 进程 ， 那 VMID 的 格式 应 当 是 : 





[Protocol:] [//]1vmid[ehostname [ :Port]/servername] 





参数 interval 和 count 代 表 查 询 间隔 和 次 数 ， 如 果 省 略 这 两 个 参数 ， 说 明 只 查询 一 次 。 假 设 需要 每 250 毫 秒 查询 一 次 进程 2764 垃 圾 收集 的 状况 ， 一 共 查 询 20 次 ， 那 命令 应 当 是 : 





jstat -gc 2764 250 20 























要 分 为 3 类 : 类 装载 、 垃 圾 收集 和 运行 期 编译 状况 ， 具 体 选 项 及 作用 请 参考 表 4-3 中 的 描述 。 





选项 option 代 表 着 用 户 希 望 查询 的 虚拟 机 信息 ， 











表 4-3 jstat 工 具 主要 选项 








选 项 作 用 
-class 监视 类 装载 、 抒 载 数 量 、 总 空间 及 类 装载 所 耗费 的 时 间 
-gC 监视 Java 堆 状 况 ， 包 括 Eden 区 、2 个 survivor 区 、 老 年 代 、 永 久 代 等 的 容量 、 已 用 
空间 、GC 时 间 合 计 等 信息 
-gccapacity 监视 内 容 与 -gc 基本 相同 ， 但 输出 主要 关注 Java 堆 各 个 区 域 使 用 到 的 最 大 和 最 小 空间 
-gcutil 监视 内 容 与 -gc 基本 相同 ， 但 输出 主要 关注 已 使 用 空间 占 总 空间 的 百分比 
-gccause 与 -gcutil 功能 一 样 ， 但 是 会 额外 输出 导致 上 一 次 GC 产生 的 原因 
-gcnew 监视 新 生 代 GC 的 状况 
-gcnewcapacity 监视 内 容 与 - gcnew 基本 相同 ， 输 出 主要 关注 使 用 到 的 最 大 和 最 小 空间 
-gcold 监视 老年 代 GC 的 状况 
-gcoldcapacity 监视 内 容 与 - gcold 基本 相同 ， 输 出 主要 关注 使 用 到 的 最 大 和 最 小 空间 
-gcpermcapacity 输出 永久 代 使 用 到 的 最 大 和 最 小 空间 
-compiler 输出 JIT 编译 器 编译 过 的 方法 、 耗 时 等 信息 
-printcompilation 输出 已 经 被 IIT 编译 的 方法 


jstat 监 视 选项 众多 ， 圈 于 版 面 原因 无 法 逐一 演示 ， 这 里 仅 举 一 例 监视 一 台 刚 刚 启动 的 GlassFish v3 服务 器 的 内 存 状况 的 例子 来 演示 如 何 查 看 监视 结果 。 监 视 参 数 与 输出 结果 如 代码 清单 4-1 所 示 。 





代码 清单 4-1 jstat 执 行 样 例 





D:\Develop\Java\jdk1.6.0 21\bin>jstat -gcutil 2764 
S0 S E om a YGC YGCT FGC FGCT GCT 
0.00 0.00 6.20 41.42 47.20 16 0.105 3 0.472 0.577 














查询 结果 表明 : 这 人 台 服 务 器 的 新 生 代 Eden 区 (E， 表 示 Eden) 使 用 了 6.2% 的 空间 ， 两 个 Survivor 区 (S0、S1， 表 示 Survivor0、Survivor1) 里 面 都 是 空 的 ， 老 年 代 (O， 表 示 OId) 和 永久 代 (P， 表 示 
Permanent) 则 分 别 使 用 了 41.42% 和 47.20% 的 空间 。 程 序 运 行 以 来 共 发 生 Minor GC (YGC， 表 示 Young GC) 16 次 ， 总 耗 时 0.105 秒 ， 发 生 Full GC (FGC， 表 示 Full GC) 3 次 ，Full GC 总 耗 时 (FGCT， 
表示 Full GC Time) 为 0.472 秒 ， 所 有 GC 总 耗 时 (GCT， 表 示 GC Time) 为 0.577 秒 。 






























































使 用 stat 工 具 在 纯 文本 状态 下 监视 虚拟 机 状态 的 变化 ， 确 实 不 如 后 面 将 会 提 到 的 VisualVM 等 可 视 化 的 监视 工具 直接 以 图 表 展 现 的 那样 直观 。 但 许多 服务 器 管理 员 都 习惯 了 在 文本 控制 台中 工作 ， 直 接 在 
控制 台中 使 用 stat 命 令 依然 是 一 种 常用 的 监控 方式 。 
















































































4.2.3 jinfo: Java 配 置信 息 工 具 














jinfo (Configuration Info for Java) 的 作用 是 实时 地 查看 和 调整 虚拟 机 的 各 项 参数 。 使 用 ps 命令 的 -v 参 数 可 以 查看 虚拟 机 启动 时 显 式 指定 的 参数 列表 ， 但 如 果 想 知道 未 被 显 式 指定 的 参数 的 系统 默认 
值 ， 除 了 去 找 资料 外 ， 就 只 能 使 用 jinfo 的 -flag 选 项 进行 查询 了 (如 果 只 限于 JDK 1.6 或 以 上 版 本 的 话 ， 使 用 ava-XX: +PrintFlagsFinal 查 看 参数 默认 值 也 是 一 个 很 好 的 选择 ) ，jinfo 还 可 以 使 用 -sysprops 
选项 把 虚拟 机 进程 的 System.getProperties() 的 内 容 打 印 出 来 。 这 个 命令 在 JDK 1.5 时 期 已 经 随 着 Linux 版 的 JDK 发 布 ， 当 时 只 提供 了 信息 查询 的 功能 ，JDK 1.6 之 后 ，jinfo 在 Windows 和 Linux 平 台 都 有 提 
供 ， 并 且 加 入 了 运行 期 修改 参数 的 能 力 ， 可 以 使 用 -flag[+|-]name 或 -flag name=value 修 改 一 部 分 运行 期 可 写 的 虚拟 机 参数 值 。JDK 1.6 中 ，jinfo 对 于 Windows 平 台 的 功能 仍然 有 较 大 的 限制 ， 只 提供 了 最 
基本 的 -flag 选 项 。 







































































jinfo 命 令 格式 : 





jinfo [ option ] pid 





执行 样 例 : 查询 CMSInitiatingOccupancyFraction 参 数值 。 





C:\>jinfo -flag CMSInitiatingOccupancyFraction 1444 
~XX:CMSInitiatingOccupancyFraction=85 


4.2.4 jmap: Java 内 存 映像 工具 




















jmap (Memory Map for Java) 命令 用 于 生成 堆 转 储 快照 (一般 称 为 heapdump 或 dump 文 件 ) 。 如 果 不 使 用 map 命 令 ， 要 想 获 取 jJava 堆 转 储 快照 还 有 一 些 比较 “暴力 ”的 手段 : 譬如 在 第 2 章 中 
过 的 -XX: +HeapDumpOnOutOfMemoryError 参 数 ， 可 以 让 虚拟 机 在 OOM 异 常 出 现 之 后 自动 生成 dump 文 件 ， 通 过 -XX: +HeapDumpOnCtrlBreak 参 数 则 可 以 使 用 [Ctrl]+[Break] 键 让 虚拟 机 生成 
dump 文 件 ， 又 或 者 在 Linux 系 统 下 通过 Kill-3 命 令 发 送 进程 退出 信号 “和 丽 吓 ”一 下 虚拟 机 ， 也 能 拿 到 dump 文 件 。 


















































jmap 的 作用 并 不 仅仅 是 为 了 获取 dump 文 件 ， 它 还 可 以 查询 finalize 执 行 队列 ，Java 堆 和 永久 代 的 详细 信息 ， 如 空间 使 用 率 、 当 前 用 的 是 哪 种 收集 器 等 。 





















































和 jinfo 命 令 一 样 ，jmap 有 不 少 功能 在 Windows 平 台 下 都 是 受 限 的 ， 除 了 生成 dump 文 件 的 -dump 选 项 和 用 于 查看 每 个 类 的 实例 、 空 间 占用 统计 的 -histo 选 项 所 有 操作 系统 都 提供 之 外 ， 其 余 选 项 都 只 
能 在 Linux/Solaris 下 使 用 。 




















jmap 命 令 格式 : 





jmap [ option ] vmid 








option 选 项 的 合法 值 与 具体 含义 如 表 4-4 所 示 。 


表 4-4 jmap 工 具 主 要 选项 





~ Ah 

-dump 生成 Java 堆 转 储 快 照 。 格 式 为 : -dump:[live,]format=b.file=<filename>， 其 中 live 
子 参数 说 明 是 否 只 dump 出 存活 的 对 象 

-finalizerinfo 显示 在 F-Queue 中 等 待 Finalizer 线程 执行 finalize 方 法 的 对 和 象 。 只 在 Linux/ 
Solaris 平台 下 有 效 

-heap 显示 Java 堆 详 细 信 息 ， 如 使 用 哪 种 回收 器 、 参 数 配 置 、 分 代 状 况 等 。 只 在 Linux / 
Solaris 平台 下 有 效 

-histo 显示 堆 中 对 象 统计 信息 ， 包 括 类 、 实 例 数 量 和 合计 容量 

-permstat 以 ClassLoader 为 统计 口径 显示 永久 代 内 存 状 态 。 只 在 Linux / Solaris 平台 下 有 效 

-F 当 虚 拟 机 进程 对 -dump 选项 没有 了 响应 时 ， 可 使 用 这 个 选项 强制 生成 dump 快照 。 只 


在 Linux / Solaris 平台 下 有 效 

















代码 清单 4-2 是 使 用 map 生 成 一 个 正在 运行 的 Eclipse 的 dump 快 照 文件 的 例子 ， 例 子 中 的 3500 是 通过 jps 命 令 查询 到 的 LVMID。 


代码 清单 4-2 使 用 map 生 成 dump 文 件 





C:\Users\IcyFenix>jmap -dump:format=b, file=eclipse.bin 3500 
Dumping heap to C:\Users\IcyFenix\eclipse.bin http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 
Heap dump file created 





4.2.5 jhat: 虚拟 机 堆 转 储 快照 分 析 工 具 














Sun JDK 提 供 jhat (JVM Heap Analysis Tool) 命令 与 map 搭 配 使 用 ， 来 分 析 jmap 生 成 的 堆 转 储 快照 。jhat 内 置 了 一 个 微型 的 HTTP/HTML 服 务 器 ， 生 成 dump 文 件 的 分 析 结 果 后 ， 可 以 在 浏览 器 中 查 
看 。 不 过 实事 求 是 地 说 ， 在 实际 工作 中 ， 除 非 笔者 手 上 真 的 没有 别 的 工具 可 用 ， 否 则 一 般 都 不 会 去 直接 使 用 jhat 命 令 来 分 析 dump 文 件 ， 主 要 原因 有 二 : 一 是 一 般 不 会 在 部 署 应 用 程序 的 服务 器 上 直接 分 析 
dump 文 件 ， 即 使 可 以 这 样 做 ， 也 会 尽量 将 dump 文 件 拷贝 到 其 他 机 器 向 上 进行 分 析 ， 因 为 分 析 工 作 是 一 个 耗 时 而 且 消 耗 硬件 资源 的 过 程 ， 既 然 都 要 在 其 他 机 器 上 进行 ， 就 没 必要 受到 命令 行 工具 的 限制 了 。 
另外 一 个 原因 是 jhat 的 分 析 功能 相对 来 说 比较 简陋 ， 后 文 将 会 介绍 到 的 VisualVM ， 以 及 专业 用 于 分 析 dump 文 件 的 Eclipse Memory Analyzer、IBM HeapAnalyzer] 等 工具 ， 都 能 实现 比 jhat 更 强大 更 专业 






















































































































































































的 分 析 功能 。 代 码 清单 4-3 演 示 了 使 用 hat 分 析 上 一 节 采 用 jimap 生 成 的 Eclipse 1DE 的 内 存 快照 文件 。 











代码 清单 4-3 ”使 用 hat 分 析 dump 文 件 





C:\Users\IcyFenix>jhat eclipse.bin 

Reading from eclipse.binhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 

Dump file created Fri Nov 19 22:07:21 CST 2010 

Snapshot read, resolvinghttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 

Resolving 1225951 objectshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 

Chasing references, expect 245 dotshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/..http://www.hzcourse.com/resource/re 
Eliminating duplicate referenceshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/O0EBPS/Text/... 

Snapshot resolved. 

Started HTTP server on port 7000 

Server is ready. 





屏幕 显示 “Server is ready.” 的 提示 后 ， 用 户 在 浏览 器 中 键入 http://localhost:7000/ 就 可 以 看 到 分 析 结 果 ， 如 图 4-3 所 示 。 





分 析 结 果 默 认 以 包 为 单位 进行 分 组 显示 ， 分 析 内 存 泄漏 问题 主要 会 使 用 到 其 中 的 “Heap Histogram” (与 jmap-histo 功 能 一 样 ) 与 OQL 页 签 的 功能 ， 前 者 可 以 找到 内 存 中 总 容量 最 大 的 对 象 ， 后 者 是 
标准 的 对 象 查询 语言 ， 使 用 类 似 SQL 的 语法 对 内 存 中 的 对 象 进行 查询 统计 ， 读 者 若 对 OQL 有 兴趣 的 话 可 以 参考 本 书 附 录 D 的 介绍 。 


、 
处 All Classes (excluding platform) -~ Windows Internet Explorer \ 忆 | 回 | 有 | 


OO- | http://localhost:7000/ v| 钻 | 他 | X | | 图 三 人 一 大 .4 二 初 香 Pr 
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Package org. osgi. service. url 


class org. osgi. service. url. AbstractURLStreamHandlerService [0x5fde8a8] 
class org. osgi. service. url. URLStreamHandlerService [0x5fdd868] 
class org. osgi,. service. url. URLStreamHandlerSetter [0x716f858] 











Package org.osgi.util. tracker 


class org.osgi. util. tracker. AbstractTracked [0x5e73888] 

class org. osgi. util. tracker. ServiceTracker [0x5e702a0] 

class org. osgi.util. tracker. ServiceTracker$1 [0x5fb3a50] 

class org. osgi.util. tracker. ServiceTracker$AllTracked [0x5e74090] 
class org. osgi. util. tracker. ServiceTracker$Tracked [0x5e73c58] 
class org. osgi. util. tracker. ServiceTrackerCustomizer [0x5d2a428] 


Other Queries 





e All classes including platform 

e Show all members of the rootset 

e Show _ instance counts for all classes (including platform) 

e Show instance counts for all classes (excluding platform) 

e Show heap histogram 

e Show finalizer summary 

e。Execute Object _ Query Language (0QL) query [ 司 





4 | 加 | » 


@ Internet | 保护 醒 式 : 禁用 ,AN 四 100% 








图 4-3 jhat 的 分 析 结果 


4.2.6 jstack: Java 堆 栈 跟踪 工具 


jstack (Stack Trace for Java) 命令 用 于 生成 虚拟 机 当前 时 刻 的 线程 快照 (一般 称 为 threaddump 或 javacore 文 件 ) 。 线 程 快照 就 是 当前 虚拟 机 内 每 一 条 线程 正在 执行 的 方法 堆栈 的 集合 ， 生 成 线程 快 
照 的 主要 目的 是 定位 线程 出 现 长 时 间 停顿 的 原因 ， 如 线程 间 死 锁 、 死 循环 、 请 求 外 部 资源 导致 的 长 时 间 等 待 等 都 是 导致 线程 长 时 间 停 顿 的 常见 原因 。 线 程 出 现 停顿 的 时 候 通 过 jstack 来 查看 各 个 线程 的 调用 
堆栈 ， 就 可 以 知道 没有 响应 的 线程 到 底 在 后 台 做 些 什么 事情 ， 或 者 等 待 着 什么 资源 。 














jstack 命 令 格 式 : 





jstack [ option ] vmid 





option 选 项 的 合法 值 与 具体 含义 如 表 4-5 所 示 。 


表 4-5 jstack 工 具 的 主要 选项 





选项 作 用 
< 当 正 常 输出 的 请 求 不 被 响应 时 ， 强 制 输出 线程 堆栈 
-1 除 堆栈 外 ， 显 示 关 于 锁 的 附加 信息 
-m 如 果 调 用 到 本 地 方法 的 话 ， 可 以 显示 C/C++ 的 堆栈 











代码 清单 4-4 是 使 用 stack 查 看 Eclipse 线程 堆栈 的 例子 ， 例 子 中 的 3500 是 通过 jps 命 令 查询 到 的 LVMID。 

















代码 清单 4-4 ”使 用 jstack 查 看 线程 堆栈 (部 分 结果 ) 





C:\Users\IcyFenix>jstack -1 3500 
2010-11-19 23:11;28 
Full thread dump Java HotSpot (TM) 64-Bit Server VM (17.1-b03 mixed mode): 
"[ThreadPool Manager] - Idle Thread" daemon prio=6 tid=0x0000000039dd4000 nid=0xf50 in Object.wait() [0x000000003c96£000] 
java.lang.Thread.State: WAITING (on object monitor) 
at java.lang.Object .wait (Native Method) 
=- waiting on <0x0000000016bdcc60> (a org.eclipse.equinox.internal .util.impl.tpt.threadpool .Executor) 
at java.lang.Object .wait (Object .java:485) 
at org.eclipse.equinox.internal .util.impl.tpt.threadpool .Executor.run (Executor.java:106) 
— locked <0x0000000016bdcc60> (a org.eclipse.equinox.internal .util.impl.tpt.threadpool .Executor) 
Locked ownable synchronizers: 
- None 























在 JDK 1.5 中 ，java.lang.Thread 类 新 增 了 一 个 getAllStackTraces() 方 法 用 于 获取 虚拟 机 中 所 有 线程 的 StackTraceElement 对 象 。 使 用 这 个 方法 可 以 通过 简单 的 几 行 代码 就 完成 stack 的 大 部 分 功能 ,在 




















实际 项 目 中 不 妨 调用 这 个 方法 做 个 管理 员 页 面 ， 可 以 随时 使 用 浏览 器 来 查看 线程 堆栈 ， 如 代码 清单 4-5 所 示 ， 这 是 笔者 的 一 个 小 经 验 。 

















代码 清单 4-5 ”查看 线程 状况 的 JSP 页 面 





<%@ page import="java.util.Map"%®> 
<html> 
<head> 
<title> 服 务 器 线程 信息 </title> 
</head> 
<body> 
<pre> 
< 各 
for (Map.Entry<Thread, StackTraceElement[]> stackTrace : Thread.getAllStackTraces() .entrySet ()) { 
Thread thread = (Thread) stackTrace.getKey(); 


StackTraceElement[] stack = (StackTraceElement[]) stackTrace.getValue(); 
if (thread.equals (Thread.currentThread())) { 
continue; 


} 

out .Print ("\n 线 程 : " + thread.getName () + "\n"); 

for (StackTraceElement element : stack) { 
out.print ("\t"+telement+"\n"); 





[1] http://download.oracle.com/javase/6/docs/technotes/tools/index.html。 


[中 tools.jar 中 的 类 库 不 属于 Java 的 标准 API， 如 果 引 入 这 个 类 库 ， 就 意味 着 你 的 程序 只 能 运行 于 SunHotspot (或 一 些 从 Sun 买 了 JDK 的 源码 License 的 虚拟 机 ， 如 IBM J9、BEA JRockit) 上 面 ， 或 者 在 部 署 程序 时 
需要 一 起 部 署 tools.jar。 

[3] 需要 远程 主机 提供 RMI 支 持 ，Sun 提 供 了 jstatd 工 具 可 以 很 方便 地 建立 远程 RMI 服 务 器 。 

[必用 于 分 析 的 机 器 一 般 也 是 服务 器 ， 由 于 加 载 dump 快 照 文件 需要 比 生成 dump 更 大 的 内 存 ， 所 以 一 般 在 64 位 JDK、 大 内 存 的 服务 器 上 进行 。 

[5] IBM HeapAnalyzer 用 于 分 析 IBMJ9 康 拟 机 生成 的 映像 文件 ， 各 个 虚拟 机 产生 的 映像 文件 格式 并 不 一 致 ， 所 以 分 析 工具 也 不 能 通用 。 


4.3 JDK 的 可 视 化 工具 


出 来 成 为 可 以 独立 发 展 的 开源 项 目 。 


析 。 

































































JDK 中 除了 提供 大 量 的 命令 行 工具 外 ， 还 有 两 个 功能 强大 的 可 视 化 工具 : JConsole 和 VisualVM， 这 两 个 工具 是 JDK 的 正式 成 员 ， 没 有 被 贴 上 “unsupported and experimental” 的 标签 。 















































其 中 JConsole 是 在 JDK 1.5 时 期 就 已 经 提供 的 虚拟 机 监控 工具 ， 而 VisualVM 在 JDK 1.6Update7 中 才 首次 发 布 ， 现 在 已 经 成 为 Sun (Oracle) 主力 推动 的 多 合 一 故障 处 理工 具 [1]， 并 且 已 经 从 JDK 中 分 离 














为 了 避免 本 节 的 讲解 成 为 对 软件 说 明文 档 的 简单 翻译 ， 笔 者 准备 了 一 些 代 码 样 例 ， 都 是 笔者 特意 编写 的 反面 教材 。 后 面 将 会 使 用 两 款 工具 去 监控 和 分 析 这 几 段 代码 存在 的 问题 ， 算 是 本 节 简 单 的 实战 分 
读者 可 以 把 在 可 视 化 工具 上 观察 到 的 数据 和 现象 与 前 面 两 章 中 讲解 的 理论 知识 互相 印证 。 























4.3.1 JConsole: Java 监 视 与 管理 控制 台 











JConsole (Java Monitoring and Management Console) 是 一 款 基 于 JMX 的 可 视 化 监视 和 管理 的 工具 。 它 管理 部 分 的 功能 是 针对 JMX MBean 进 行 管 理 ， 由 于 MBean 可 以 使 用 代码 、 中 间 件 服务 器 














的 管理 控制 台 或 者 所 有 符合 JMX 规 范 的 软件 进行 访问 ， 所 以 本 节 中 将 会 着 重 介绍 JConsole 监 视 部 分 的 功能 。 





1. 启 动 JConsole 


使 























通过 JDK/bin 目 录 下 的 “jconsole.exe” 启 动 JConsole 后 ， 将 自动 搜索 出 本 机 运行 的 所 有 虚拟 机 进程 ， 不 需要 用 户 自己 再 使 用 jps 来 查询 了 ， 如 图 4-4 所 示 。 双 击 选 择 其 中 一 个 进程 即 可 开始 监控 ， 也 可 以 





















































下 面 的 “远程 进程 ”功能 来 连接 远程 服务 器 ， 对 远程 虚拟 机 进行 监控 。 





兆 郑 : 全 典 远 稿 争 尽 咋 鸣 篇 范 似 否 . 


吕 远程 进程 : 
Le 


卫 洱 : 《hostnamey>:《port> 热 service: jax:《protocol>:《s5apy> 


Po: | ns: | 





图 4-4 JConsole 连 接 页 面 





从 图 4-4 中 可 以 看 到 笔者 的 机 器 现在 运行 了 Eclipse、JConsole 和 MonitoringTest 一 共 三 个 本 地 虚拟 机 进程 ， 其 中 MonitoringTest 就 是 笔者 准备 的 “反面 教材 ”代码 之 一 。 双 击 它 进入 JConsole 主 界 
面 ,可 以 看 到 主 界面 里 共 包括 “概述 。、“ 内 存 ”、“ 线 程 。、“ 类 ”、“VM 摘 要 ”和 “MBean” 六 个 页 签 ， 如 图 4-5 所 示 。 





[区 Java 监 祝 和 和 管理 深 制 台 - pid: 2568 com fenizsoft. monitoring. MonitoringTest 








时 间 范 围 

堆 内 存 使 用 情况 

100 Mb 

80 Mb 

60 Mb 

40 Mb 已 愧 用 

20 Mb 24, 185, 712 
0.0 Mb 


19:55 20:00 20:05 





已 使 用 : 24.2 Mb 已 捍 交 : 101.4 Im 服 大 信 : 101.4 Mb 

















4-5 JConsole 主 界面 





“概述 ”页 签 显示 的 是 整个 虚拟 机 主要 运行 数据 的 概览 ， 其 中 包括 “ 扒 内 存 使 用 情况 ”、 “线程 ”、“ 类 ”、“CPU 使 用 情况 ”四 项 信息 的 曲线 图 ， 这 些 曲 线 图 是 后 面 “ 内 存 ”、 “线程 ”、 “类 " 页 
签 的 信息 汇总 ， 具 体内 容 将 在 后 面 介绍 。 

















2. 内 存 监控 





“内 存 ” 页 签 相当 于 可 视 化 的 jstat 命 令 ， 用 于 监视 受 收集 器 管理 的 虚拟 机 内 存 (Java 堆 和 永久 代 ) 的 变化 趋势 。 我 们 通过 运行 代码 清单 4-6 中 的 代码 来 体验 一 下 它 的 监视 功能 。 运 行 时 设置 的 虚拟 机 参数 
为 : -Xms100m-Xmx100m-XX: +UseSerialGC， 这 段 代码 的 作用 是 以 64KB/50 毫 秒 的 速度 往 Java 堆 中 填充 数据 ， 一 共 填 充 1000 次 ,使 用 JConsole 的 “内 存 ” 页 签 进行 监视 ， 观 察 曲 线 和 柱状 指示 图 的 变 
化 。 






































代码 清单 4-6 ”JConsole 监 视 代码 





太太 


占 位 符 对 象 ， 一 个 00MObject 大 约 占 64K 


static class OOMObject { 
public byte[] placeholder = new byte[64 * 1024]; 


public static void fillHeap(int num) throws InterruptedException { 
List<OOMObject> list = new ArrayList<OOMObject>(); 
for (int i = 0 1 < my i++) 4 
// 稍 作 延 时 ， 令 监视 曲线 的 变化 更 加 明显 
Thread.sleep (50) 
list.add (new OOMObJject () ) 7 
} 
System.gc(); 

} 

public static void main (String[] args) throws Exception { 
fillHeap (1000); 

} 





程序 运行 后 ， 在 “内 存 ” 页 签 中 可 以 看 到 内 存 池 Eden 区 的 运行 趋势 呈现 折线 状 ， 如 图 4-6 所 示 。 而 监视 范围 扩大 至 整个 堆 后 ， 会 发 现 曲线 是 一 条 向 上 增长 的 平滑 曲线 。 并 且 从 柱状 图 可 以 看 到 ， 在 1000 
次 循环 执行 结束 ， 运 行 了 System.gc( 后 ， 虽 然 整个 新 生 代 Eden 和 Survivor 区 都 基本 被 清空 了 ， 但 是 代表 老年 代 的 柱状 图 仍然 保持 峰值 状态 ， 说 明 被 填充 进 堆 中 的 数据 在 System.gc() 方 法 执行 之 后 仍然 存活 
着 。 笔 者 的 分 析 就 到 此 为 止 ， 提 两 个 小 问题 供 读者 思考 一 下 ， 答 案 在 下 一 页 。 














1) 虚拟 机 启动 参数 只 限制 了 Java 堆 为 100MB， 没 有 指定 -Xmn 参 数 ， 能 否 从 监控 图 中 估计 出 新 生 代 有 多 大 ? 








2) 为 何 执行 了 System.gc0 之 后 ， 图 4-6 中 代表 老年 代 的 柱状 图 仍然 显示 为 峰值 状态 ， 代 码 需 要 如 何 调整 才能 让 System.gc0 回 收 掉 填 充 到 堆 中 的 对 象 ? 











4 


图 表 : [内存 池 “Eden Space” v 


See 上 上 TTT tt tt 


已 必用 
4 1,661,592 


详细 信息 


时 间 : 2010-11-20 19:48:54 
已 使 用 : 1, 353 Kb 
分 本 : 27, 328 Kb 
最 大 值 : 7,328 Kb 
| 


GC 时 间 : Copy (2 项 收集 ) 所 用 的 时 间 
为 0.083 种 


MarkSwespCompact《1 项 收集 ) 所 用 的 时 间 
为 0.054 种 

















图 4-6 Eden 区 内 存 变化 状况 

















问题 1 的 答案 : 图 4-6 显 示 Eden 空 间 为 27328KB， 因 为 没有 设置 -XX: SurvivorRadio 参 数 ， 所 以 Eden 与 Survivor 空 间 比例 为 默认 值 8 : 1， 因 此 整个 新 生 代 空间 大 约 为 27，328KBx125%=34，160KB。 

















问题 2 的 答案 : System.gc0 之 后 ， 空 间 未 能 回收 是 因为 List<OOMObject>list 对 象 仍然 存活 着 ，fillHeap0 方 法 仍然 没有 退出 ， 因 此 上 ist 对 象 在 执行 System.gc0 时 仍然 处 于 作用 域 之 内 欠 。 如 果 把 
System.gc() 移 动 到 fillHeap0 方 法 外 ， 调 用 就 可 以 回收 掉 全 部 内 存 。 














3. 线 程 监控 


如 果 上 面 的 “内 存 ” 页 签 相当 于 可 视 化 的 jstat 命 令 的 话 ，“ 线 程 ”页 签 的 功能 则 相当 于 可 视 化 的 jstack 命 令 ， 遇 到 线程 停顿 的 时 候 可 以 使 用 这 个 页 签 进行 监控 分 析 。 前 面 讲解 jstack 命 令 的 时 候 提 到 过 线 
程 长 时 间 停顿 的 主要 原因 有 : 等 待 外 部 资源 (数据 库 连接 、 网 络 资源 、 设 备 资源 等 ) 、 死 循环 、 锁 等 待 〈 活 锁 和 死 锁 ) 。 通 过 代码 清单 4-7 分 别 演示 一 下 这 几 种 情况 。 





代码 清单 4-7 ”线程 等 待 演示 代码 





en 


public static void createBusyThread() { 
Thread thread = new Thread (new Runnable() { 
QOverride 
public void run() { 
while (true)  // 第 41 行 


} 
}, "testBusyThread"); 
thread. start (); 
} 


/** 
个 


public static void createLockThread (final Object lock) { 
Thread thread = new Thread (new Runnable() { 
QOverride 
public void run() { 
synchronized (lock) { 
te 4 
lock.wait (); 
} catch (InterruptedException e) { 
e.printSstackTrace () 7 
} 
} 


} 
}, "testLockThread"); 
thread. start (); 
} 


public static void main (String[] args) throws Exception { 
BufferedReader br = new BufferedReader (new InputStreamReader (System.in) ) 7 
br.readLine () 7 
CreateBusyThread (); 
r.readLine(); 
bject obj = new Object (); 


reateLockThread (obj ) 7 








程序 运行 后 ， 首 先 在 “线程 ”页 签 中 选择 main 线 程 ， 如 图 4-7 所 示 。 堆 栈 追 踪 显 示 BufferedReader 在 readBytes 方 法 中 等 待 System.in 的 键盘 输入 ， 这 时 候 线程 为 Runnable 状 态 ，Runnable 状 态 的 进程 
会 被 分 配 运行 时 间 ， 但 readBytes 方 法 检查 到 流 没有 更 新 时 会 立刻 归还 执行 令 牌 ， 这 种 等 待 只 消耗 很 小 的 CPU 资源 。 


线程 
EE |: nain “ 


Reference Handler 状态 : RUNNABLE 
阻塞 总 数 : 0 等待 总 数 : 0 










Finalizer 











Sienal Dispatcher 
Attach Listener 
testBusyIThread 
RMI ICP Accept-0 
RMI TCP Cormection(l)-192. 168. java, i0.FileInputStream. read(FileInputStream. java: 199) 


RMI Scheduler (0) ~ ljava.io.BufferedInputStreanm. readl (BufferedInputStream. java:256) ~ 


; > 


堆栈 追踪 : 
java. i0.FileInputStream. readBytes (Native Method) 





图 4-7 ” main 线程 


接着 监控 testBusyThread 线 程 ， 如 图 4-8 所 示 ，testBusyThread 线 程 一 直 在 执行 空 循环 ， 从 堆栈 追踪 中 可 以 看 到 一 直 停 留 在 MonitoringTest.java 代 码 的 41 行 ，41 行 为 while(true)。 这 时 候 线程 为 
Runnable 状 态 ， 而 且 没 有 归还 线程 执行 令 牌 的 动作 ， 会 在 空 循环 上 用 尽 全 部 执行 时 间 直 到 | 线程 切换 ， 这 种 等 待 会 消耗 较 多 的 CPU 资 源 。 





























图 4-9 显 示 testLockThread 线 程 在 等 待 着 lock 对 象 的 notify 或 notifyAll 方 法 的 出 现 ， 线 程 这 时 候 处 在 WAITING 状 态 ， 在 被 唤醒 前 不 会 被 分 配 执 行 时 间 。 


testLockThread 线 程 正 处 于 正常 的 活 锁 等 待 状态 。 只 要 lock 对 象 的 notify0 或 notifyAll0 方 法 被 调用 ， 这 个 线程 便 能 激活 以 继续 执行 。 代 码 清单 4-8 演 示 了 一 个 无 法 再 被 激活 的 死 锁 等 待 。 





线程 

main ^ |: testBusyIhread 全 
Reference Handler : RUNNABLE 

Finalizer 总 数 : 0 ”等 待 总 数 : 0 


Sienal Dispatcher 
Attach Listener 


testBusyIThread 追踪 : 
RMI ICP Accept-0 fenixsoft.monitoring. MonitoringTest$1. run (I (p00) 


RMI ICP Connection(1)-192. 168. . lang. Ihread. run(Ihread. java: 662) 
RMI Scheduler (0) 








图 4-8 ”testBusyThread 线 程 





a Ea 


Attach Listener 名 称 : testLockIhread 

testBusyThread 状态 : WAITING 在 java. lang.0bject@3c83ad0 上 
RMI ITCP Accept-0 阻塞 总 数 : 0 等 待 总 数 : 1 

RMI ICP Cornmection(l)-192. 168. 

RMI Scheduler (0) 


JWMX server corrmectior timeout 
RMI ICP Connection (2)-192. 168. java. lang. Object. wait (Native Method) 


RMI TCP Commection(5)-192. 168. java. lang. Object. wait (Object. java: 485) 


testLockIhread = |com.fenixsoft.monitoring.MonitoringTest$2. run(MonitoringTest. javVal 
1 [EL 4 [EL 





图 4-9 testLockThread 线 程 


代码 清单 4-8” 死 锁 代 码 样 例 





/x 
全 大 全 和 全 和 你 


static class SynAddRunalbe ;implements Runnable { 
TnL ,dy by 
public SynAddRunalbe (int a, int b) { 
this.a = a; 


QOverride 
public void run() { 
synchronized (Integer.valueof (a)) { 
synchronized (Integer.valueOf (b)) { 


System.out .Println(a + b); 
} 
} 


i 


} 


public static void main (String[] args) { 
for (int i = 0; i < 100; i++) { 


new Thread (new SynAddRunalbe (1, 2)).start(); 
new Thread (new SynAddRunalbe (2, 1)).start(); 


} 


bE 





这 段 
循环 的 版 
这 个 范围 




















代码 开 了 200 个 线程 分 别 去 计算 1+2 及 2+1 的 值 ， 


其 实 for 循 环 是 可 省 略 的 ， 两 个 线程 也 可 能 会 导致 死 锁 ， 不 过 那样 概率 太 小 ， 需 要 党 试 运行 很 多 次 才能 看 到 效果 。 如 果 运 气 不 是 特别 差 的 话 ， 带 for 





本 最 多 运行 2~ 3 次 就 会 遇 到 线程 死 锁 ， 程 序 无 法 结束 。 造 成 死 锁 





的 原因 是 Integer.valueOf() 方 法 基于 减少 对 象 创建 次 数 和 节省 内 存 的 考虑 ，[-128，127] 之 间 的 数字 会 被 缓存 B]， 当 valueOf( 方 法 在 

















之 内 传 入 参数 ， 将 直接 返回 缓存 中 的 对 象 。 也 就 是 说 代码 中 调 


了 200 次 Integer.valueOf() 方 法 一 共 就 只 返回 了 两 个 不 同 的 对 象 。 假 如 在 某 个 线程 的 两 个 synchronized 块 之 间 发 生 了 一 次 线程 切 


换 ， 就 会 出 现 线程 A 等 着 被 线程 B 持 有 的 Integer.valueOf(1)， 线 程 B 又 等 着 被 线程 A 持 有 的 Integer.valueOf(2)， 结 果 大 家 都 跑 不 下 去 的 情景 。 


出 现 





Thread-199 


Thread-43 


Thread-12 











线程 死 锁 之 后 ， 点 击 JConsole 线 程 面板 的 “检测 到 死 锁 ”的 按钮 ， 将 出 现 一 个 新 的 “ 死 锁 ”页 签 ， 如 图 4-10 所 示 。 























堆栈 追踪 : 
com. fenixsoft. monitoring. ThreadDeadLockTest$SynAddRunalbe. run'lThr! 
- 已 谈 定 java. lang. Integer@76c3358b 


java. lang. TIhread. run(Ihread. java: 662) 














存在 等 到 


锁 释 放 的 希望 了 。 


4.3.2 VisualVM : 多 合 一 故障 处 理工 具 


Visu 





起 JProfiler、YourKit 等 专业 目 收 费 的 Profiling 工 


以 直接 应 








名 称 : Thread-43 
状态 : BLOCKED 在 java. lang. Integer@7cbdb375 上 ， 拥 有 者 : Thread-12 
阻塞 总 数 : 1 等 待 总 数 : 0 





图 4-10 ”线程 死 锁 


辐 中 很 清晰 地 显示 线程 Thread-43 在 等 待 一 个 被 线程 Thread-12 持 有 Integer 对 象 ， 而 点 击 线程 Thread-12 则 显示 它 也 在 等 待 一 个 Integer 对 象 ， 被 线程 Thread-43 持 有 ， 这 样 两 个 线程 就 互相 卡 住 ， 都 不 


alVM (All-in-One Java Troubleshooting Tool) 是 到 目前 为 止 ， 随 JDK 发 布 的 功能 最 强大 的 运行 监视 和 故障 处 理 程序 ， 并 且 可 以 预见 在 未 来 一 段 时 间 内 都 是 官方 主力 发 展 的 虚拟 机 故障 处 理工 









































具 。 官 方 在 VisualVM 的 软件 说 明 中 写 上 了 “All-in-One” 的 描述 字样 ， 预 示 着 它 除了 运行 监视 、 故 障 处 理 外 ， 还 提供 了 很 多 其 他 方面 的 功能 。 如 性 能 分 析 (Profiling) ，VisualVM 的 性 能 分 析 功能 甚至 比 
都 不 会 逊色 多 少 ， 而 且 VisualVM 的 还 有 一 个 很 大 优点 : 不 需要 被 监视 的 程序 基于 特殊 Agent 运 行 ， 因 此 它 对 应 用 程序 的 实际 性 能 的 影响 很 小 ， 使 得 它 可 















































1.VisualVM 兼 容 范围 与 插件 安装 


Visu 


.时 
于 











alVM 基 于 NetBeans 平 台 开 发 ， 因 此 它 一 开始 就 具备 了 插件 扩展 

















示 虚 拟 机 进程 及 进程 的 配置 和 环境 信息 (jps、jinfo) 。 


在 生产 环境 中 。 这 个 优点 是 JProfiler、YourKit 等 工具 无 法 与 之 媲美 的 。 





功能 的 特性 ， 通 过 插件 扩展 支持 ，VisualVM 可 以 做 到 : 


“ 监视 应 用 程序 的 CPU、GC、 堆 、 方 法 区 及 线程 的 信息 (jstat、jstack) 。 


“du 


mp 及 分 析 堆 转 储 快照 (jmap、jhat) 。 


“ 方法 级 的 程序 运行 性 能 分 析 ， 找 出 被 调用 最 多 、 运 行 时 间 最 长 的 方法 。 


“ 离线 程序 快照 : 收集 程序 的 运行 时 配置 、 线 程 dump、 内 存 dump 等 信息 建立 一 个 快照 ， 可 以 将 快照 发 送 开发 者 处 进行 Bug 反 馈 。 


.其 


他 plugins 的 无 限 的 可 能 性 …… 





VisualVM 在 JDK 1.6update 7 中 才 首 次 出 现 ， 但 并 不 意味 着 它 只 能 监控 运行 于 JDK 1.6 上 的 程序 ， 它 具备 很 强 的 向 下 兼容 能 力 ， 甚 至 能 向 下 兼容 至 近 10 年 前 发 布 的 JDK 1.4.2 平 台 内 ， 这 对 无 数 已 经 处 于 
护 状态 的 项 目 很 有 意义 。 当 然 ， 并 非 所 有 的 功能 都 能 完美 地 向 下 兼容 ， 主 要 特性 的 兼容 性 如 表 4-6 所 示 。 





表 4-6 VisualVM 主 要 功能 兼容 性 列表 


特 性 JDK 1.4.2 JDK 1.5 JDK 1.6 local JDK 1.6 remote 


运行 环境 信息 V V V V 
系统 属性 V 
监视 面板 V V V V 
线程 面板 V V V 
性 能 监控 a 
堆 、 线 程 Dump 
MBean 管理 V V V 
JConsole 插件 ~ V V 





首次 启动 VisualVM 后 ， 读 者 先 不 必 着 急 找 应 用 程序 进行 监测 ， 因 为 现在 VisualVM 还 没有 加 载 任何 插件 ， 虽 然 基本 的 监视 、 线 程 面板 的 功能 主 程序 都 以 默认 插件 的 形式 提供 了 ， 但 是 不 给 VisualVM 装 任 
何 扩展 插件 ， 就 相当 于 放弃 了 它 最 精华 的 功能 ， 和 没有 安装 任何 应 用 软件 操作 系统 差不多 。 








插件 可 以 手工 安装 ， 在 网 站 Pl 上 下 载 *nbm 包 后 ， 点 击 “ 工 具 ” 一 “插件 ”一 “已 下 载 ” 菜 单 ， 然 后 在 弹出 的 对 话 框 中 指定 nbm 包 路 径 便 可 进行 安装 ， 插 件 安装 后 存放 在 
JDK_HOME/lib/visualvm/visualvm 中 。 不 过 手工 安装 并 不 常用 ， 使 用 VisualVM 的 自动 安装 功能 已 经 可 以 找到 所 需 的 大 多 数 插件 ， 在 有 网 络 连接 的 环境 下 ， 点 击 “ 工 具 ” 一 “插件 ”菜单 ， 弹 出 如 图 4-11 所 
示 的 插件 页 签 ， 在 页 签 的 “可 用 插件 ”中 列举 了 当前 版 本 VisualVM 可 以 使 用 的 插件 ， 选 中 插件 后 在 右边 窗口 将 显示 这 个 插件 的 基本 信息 ， 如 开发 者 、 版 本 、 功 能 描述 等 。 











大 家 可 以 根据 自己 的 工作 需要 和 兴趣 选择 合适 的 插件 ， 然 后 点 击 安装 按钮 ， 弹 出 如 图 4-12 所 示 的 下 载 进度 窗口 ， 跟 着 提示 操作 稍 后 即 可 安装 完成 。 





安装 完 插件 后 ， 选 择 一 个 需要 监视 的 程序 就 进入 程序 的 主 界面 了 ， 如 图 4-13 所 示 。 根 据 读 者 选择 安装 插件 数量 的 不 同 ， 看 到 的 页 签 可 能 和 笔者 截图 中 的 会 有 差异 。 


VisualVM 中 “概述 ”、 “监视 ”、“ 线 程 ”、“MBeans” 的 功能 与 前 面 介 绍 的 JConsole 差 别 不 大 ， 读 者 根据 上 一 节 的 内 容 类 比 使 用 即 可 ， 下 面 挑选 几 个 特色 功能 和 插件 进行 介绍 。 





VisualVi-Glassfish 


本 


VisualVH-Glassfish Application ... 

Java ME Profiler Snap... Java ME SDK 版 本 : 1.3 
VisualVM-Extensions Platform 源 : VisualW 插件 中 心 
VisualVM-Sampler Profiling 

BIrace4Vi sualVNW Profiling 人 
VisusalVWM-Security Security 插件 描述 


DNS Tools A sample plugin giving an overview of 
VisualVM-MBeans Tools advanced monitoring capabilities of 
VisualVWM-BufferMonitor Tools VisualVM. Enhances monitoring of 
Visual CC Tools GlassFish application server by adding 
SAPlugin Tools specialized overview, new tab for 
VisualVWM 0SCi Plugin Tools monitoring HIIP Service and the ability 
SysIray Tools to visually select and monitor any of 
KillApplication Tools the deployed web applications 
VisualVM-JvmCapabilities Tools 


激活 A) | | 取消 激活 0) | | 部 载 0) 
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图 4-11 VisualVM 插 件 页 签 


下 载 
请 稍 候 ， 直 至 安装 程序 下 载 完 请 求 的 插件 。 


正在 下 载 插件 ，. 


| VisualVM-IDA-Library-Component 
在 后 台 运 行 R) 











[ 《< 上- 步 8) ][ 安装 0) 帮助 0 








图 4-12 ”VisualVM 揪 件 安装 过 程 


[文件 中 ) 应 用 程序 A) 视图 w) 工具 C) 窗口 W) 帮助 00 


SShpeans | 国 Jconsole rlvgins | 二 wisec | 





O 〇 org. eclipse. equinox. launcher. Main (pid 10112) 


”加 保存 的 数据 回 详细 信息 ， 
PID: 10112 
主机 : localhost 


主 类 : org. eclipse. equinox. launcher. Main 
参数: -os win32 -ws win32 -arch x86 -showsplash -launcher D:\ DevSpace\Eclipse_3.5\ecli 


JVN: Java HotSpot (IM) Client VM (17.0-b16，mixed mode, sharing) 
Java Home 目录 : D:\_DevSpace\jdkl.6.0 21\jre 

JW 标志 : 《无 > 

出 现 00ME 时 生成 堆 daump: 禁用 
保存 的 数据 Xx | JW 参数 | 系统 属性 | JWM capabilities 
线程 Dump: 0 -Dosgi.requiredJavaVersion=1.5 


堆 Dump: 0 -Xnx512n 
-Ins512m 





图 4-13 VisualVM 主 界面 
2. 生 成 和 浏览 堆 转 储 快照 
在 VisualVM 中 生成 dump 文 件 有 两 种 方式 ， 可 以 执行 下 列 任 一 操作 : 
* 在 “应 用 程序 ”窗口 中 右键 单 击 应 用 程序 节点 ， 然 后 选择 “ 堆 Dump”。 


“ 在 “应 用 程序 ”窗口 中 双击 应 用 程序 节点 以 打开 应 用 程序 标签 ， 然 后 在 “监视 ”标签 中 单 击 “ 堆 Dump”。 











生成 了 dump 文 件 之 后 ， 应 用 程序 页 签 将 在 该 堆 的 应 用 程序 下 增加 一 个 以 [heapdump] 开 头 的 子 节点 ， 并 且 在 主页 签 中 打开 该 转 储 快照 ， 如 图 4-14 所 示 。 如 果 需 要 把 dump 文 件 保存 或 发 送出 去 ， 要 在 


heapdump 节 点 上 右键 选择 “另存 为 ”菜单 ， 否 则 当 VisualVM 关 闭 时 ， 生 成 的 dump 文 件 会 被 当做 临时 文件 被 删除 掉 。 要 打开 一 个 已 经 存在 的 dump 文 件 ， 通 过 文件 菜单 中 的 “ 装 入 ”功能 ， 选 择 硬盘 上 的 
dump 文 件 即 可 。 








Ee 


实 件 中 应 用 程 肥 人 ) 视图 () 工具 G) 窗口 人) 帮助 00 me 





日 励 本 地 





SU wisn ET 
-er 


ore eclipse equin © YisualVYM 
: 营 远 程 堆 Dump 
mn 个 中 | 8 扩 全 [GN @ or j3 


包 [heapdunp] 10: 49:28 下 午 





[理工 本 【证 ] 





| 命 :unfontTrueTypeFontSDirectoryEntry 实例 数 : 8.830 | 实例 大 小 : 24 | 总 大 小 : 211.920 | 计算 保 置 的 大 小 | 





© this 

由 -日 this$0 

:四 leneth 
加 offset 
加 tag 


类 型 
TrueIypeFont$. . . 
TrueIypeFont 
int 115048 
int 15199196 
int 1986884728 





诅 引 用 
字段 

© this 

四 -BY [18] 








类 型 
TruelypeFont$... 
TruelypeFont$... 齐 

















图 4-14 浏览 dump 文 件 





从 堆 页 签 中 的 “摘要 ”面板 可 以 看 到 应 用 程序 dump 时 的 运行 时 参数 、System.getProperties() 的 内 容 、 线 程 堆栈 等 信息 ，“ 类 ”面板 则 是 以 类 为 统计 口径 统计 类 的 实例 数量 和 容量 信息 ，“ 实 例 ” 面 板 
Mii 因为 不 能 确定 用 户 想 查看 哪个 类 的 实例 ， 所 以 需要 通过 “类 ”面板 进入 ， 在 “类 ”中 选择 一 个 关心 的 类 后 双击 鼠标 ， 即 可 在 “实例 ”中 看 见 此 类 中 500 个 实例 的 具体 属性 信息 。“OQL 控 制 





”面板 里 面 就 是 运行 OQL 查 询 语句 的 ， 同 jhat 里 面 介绍 的 OQL 功 能 一 样 。 如 果 需 要 了 解 具体 OQL 语 法 和 使 用 ， 可 参见 本 书 附录 D 的 内 容 。 


3. 分 析 程 序 性 能 





在 Profiler 页 签 中 ，VisualVM 提 供 了 程序 运行 期 间 方 法 级 的 CPU 执行 时 间 分 析 及 内 存 分 析 ， 进 行 Profiling 分 析 肯 定 会 对 程序 运行 性 能 有 比较 大 的 影响 ， 所 以 一 般 不 在 生产 环境 中 使 用 这 项 功能 。 


要 开始 分 析 ， 先 选择 “CPU” 和 “内 存 ” 按 钮 中 的 一 个 ， 然 后 切换 到 应 用 程序 中 对 程序 进行 操作 ，VisualVM 会 记录 到 这 段 时 间 中 应 用 程序 执行 过 的 方法 。 如 果 是 CPU 分 析 ， 将 会 统计 每 个 方法 的 执行 次 
数 、 执 行 耗 时 ;如 果 是 内 存 分 析 则 会 统计 每 个 方法 关联 的 对 象 数 及 这 些 对 象 所 占 的 空间 。 分 析 结 束 后 ， 点 击 “ 停 止 ” 按 钮 结束 监控 过 程 ， 如 图 4-15 所 示 。 











日 转 本 地 
| 自 ke VisualVM ~ 
全 [heapdunp] 10:| ~ org. eclipse. equinox- launcher. Main (pid 3312) 


Profiler 


性 能 分 析 : [入 ceva] 蕊 加 所 在于 | 国信 | 


状态 : 性 能 分 析 处 于 不 活动 状态 


性 能 分 析 结果 
辆 丰富 孙 | 恒 | 加 固 | 








热点 - 方法 自用 ..- ” 自用 时 间 调用 


sun. rmi. transport. tcp. ICPIransport$ConnectionHandler.run (0 ... (59. 9% 


java. util. concurrent. ThreadPoolExecutor$NWorker. run () 
,eclipse. ui. part, Resourcelransfer. getTypelds () 
. eclipse. swt. eraphics. Image. getInageData () 
. eclipse. jface. viewers. StructuredViewer. firePostSelectionChanged 
,eclipse. jface. bindings. keys. formatting. JativeKeyFormatter. sor tModifi' 
. eclipse. jface. viewers. StructuredSelection. 《init> (java util List) 
eclipse. ui. editors. text, TextFileDocunentProvider. getStatus (0bject) 
. eclipse. swt. eraphics. Device. isDisposed () 

org. eclipse. jface. viewers. CustomHashtable. hashCode Mbjsct) 

org. eclipse. swt. wideets. Wideet. check¥ideet () 























图 4-15 ”对 应 用 程序 进行 CPU 执 行 时 间 分 析 


注意 ”在 JDK 1.5 之 后 ， 在 Client 模 式 下 的 虚拟 机 加 入 并 且 自动 开启 了 类 共享 -一 一 这 是 一 个 在 多 虚拟 机 进程 中 共享 ttjar 中 的 类 数据 以 提高 加 载 速度 和 节省 内 存 的 优化 ， 而 根据 相关 Bug 报 告 的 反 
映 ，VisualVM 的 Profiler 功 能 可 能 会 因为 类 共享 而 导致 被 监视 的 应 用 程序 前 溃 ， 所 以 读者 进行 Profiling 前 ， 最 好 在 被 监视 的 程序 中 使 用 -Xshare: off 参 数 来 关闭 类 共享 优化 。 














图 4-15 中 是 对 Eclipse 1DE 一 段 操作 的 录制 和 分 析 结 果 ， 读 者 分 析 自 己 的 应 用 程序 时 ， 可 以 根据 实际 业务 的 复杂 程度 与 方法 的 时 间 和 调用 次 数 做 比较 ， 找 到 最 有 优化 价值 的 方法 。 

















4.BTrace 动 态 日 志 跟踪 


BTracel6| 是 一 个 很 “有趣” 的 VisualVM 插 件 ， 本 身 也 是 可 以 独立 运行 的 程序 。 它 的 作用 是 在 不 停止 目标 程序 运行 的 前 提 下 ， 通 过 HotSpot 虚 拟 机 的 HotSwap 技 术 [7 动态 加 入 原本 并 不 存在 的 调试 代 
码 。 这 项 功能 对 实际 生产 中 的 程序 很 有 意义 : 经 常 遇 到 程序 出 现 问 题 ， 但 排查 错误 的 一 些 必要 信息 ， 壁 如 方法 参数 、 返 回 值 等 ， 在 开发 时 并 没有 打印 到 日 志 之 中 ， 以 至 于 不 得 不 停 掉 服务 ， 通 过 调试 增 量 来 
加 入 日 志 代 码 以 解决 问题 。 当 遇 到 生产 环境 服务 无 法 随便 停止 时 ， 缺 一 两 句 日 志 导 致 排 错 进行 不 下 去 是 一 件 非常 郁闷 的 事情 。 


在 VisualVM 中 安装 了 BTrace 插 件 后 ， 应 用 程序 面板 右键 点 击 要 调试 的 程序 ， 会 出 现 “Trace Application” 菜 单 ， 点 击 将 进入 BTrace 面 板 。 这 个 面板 里 面 看 起 来 就 像 一 个 简单 的 Java 程 序 开发 环境 , 里 
面 还 有 一 小 段 Java 代 码 ， 如 图 4-16 所 示 。 








日 | 人 VisualVW 有 2 
“ 国 [heapdunp] 10.| org. eclipse. equinox. launcher. Main (pid 3312) 
. -外 | BTrace 回 output 加 class-Path 


| 二 远程 二 0pen... 园 save As... | 好 start 图 sto | 几 Event 
强 快 昭 

/* Blrace Script Template #*/ 

import com. sun.btrace. anmnotations.*:; 


import static conm. sun.btrace.BIraceUtils.*; 


@BIrace 
public class TracingScript { 
/* put your code here | 


1 
2 
3 
4 
5 
6 
7 
8 




















图 4-16 ”BTrace 动 态 跟 踪 
笔者 准备 了 一 段 很 简单 的 Java 代 码 来 演示 BTrace 的 功能 : 产生 两 个 1000 以 内 的 随机 整数 ， 输 出 这 2 个 数字 相 加 的 结果 ， 如 代码 清单 4-9 所 示 。 


代码 清单 4-9 BTrace 跟 踪 演示 





public class BTraceTest { 
public int add(int a, int b) { 
returna+b; 
} 
public static void main (String[] args) throws IOException { 
BTraceTest test = new BTraceTest (); 
BufferedReader reader = new BufferedReader (new InputStreamReader (System.in)); 
for (int i = 0; i < 10; i++) { 
reader .readLine (); 
int a = (int) Math.round (Math.random() * 1000); 
int b = (int) Math.round (Math.random() * 1000); 
System.out .Println (test.add(a, b)); 
} 
} 





程序 运行 后 ， 在 VisualVM 中 打开 该 程序 的 监视 ， 在 BTrace 页 签 填充 TracingScript 的 内 容 ， 输 入 调试 代码 如 代码 清单 4-10 所 示 。 


代码 清单 4-10 ”BTrace 调 试 代码 





/* BTrace Script Template */ 
import com.sun.btrace.annotations.*; 
import static com.sun.btrace.BTraceUtils.*; 
QBTrace 
public class TracingScript { 
QOnMethod ( 
Clazz="org.fenixsoft .monitoring.BTraceTest", 
method="add", 
location=@Location (Kind.RETURN) 
) 
public static void func(@Self org.fenixsoft.monitoring.BTraceTest 
instance, int a,int b,@Return int result) { 
println ("调用 堆栈 :"); 
jstack (); 
println (strcat ("方法 参数 A:", str (a) ) ) 7 
println (strcat ("方法 参数 B:", str (b) ) ) ; 
println (strcat ("方法 结果 :", str (result))); 








点 击 “Start” 按 钮 后 稍 等 片刻 ， 编 译 完成 后 ， 可 见 Output 面 板 中 出 现 “BTrace code successfuly deployed” 的 字样 。 程 序 运 行 的 时 候 在 Output 面 板 将 会 输出 如 图 4-17 所 示 的 调试 信息 。 


加 Java VisualWL 


: 国 国 : 岛 货 和 曾 
SS org fenixsoft.monitoring.BIraceTest (pid 4852) % 


5 者 本 地 i 
-isam TFT | [vel 6] Rteeee 


; 让 org. fenixsoft. monitor ~ 
各 org eclipse. eminox 1(| ~ org. fenixsoft. monitoring.BTraceTest (pid 4852) 
2 外 org. eclipse. equinox. 1 BIrace Output [ 辐 Class-Path 


| 站 二 0pen... 园 save | | 思 start 回 sto | F Event... [Unsafe 
一 人 快 忠 


只 车 下 

12 

13 public static void func (@Self org.fenixsoft.monitoring.BIracelest instanc 
14 println( "调用 堆栈 :”) : 

15 jstack(): 


16 println(strcat (“方法 参数 A:“, str (a))) | 
17 println(strcat ( 方法 合 数 B: ,str(b))) 
18 println(strcat ( 万 法 结果 : ,str (result))): 








Output 
BITrace code successfuly deployed 


orE. fenixsoft. monitoring. BITraceTest.main(BIraceTest. java:20) 
方法 参数 A: 461 
方法 参数 B:548 
方法 结果 :1009 


调用 堆栈 : 


org. fenixsoft. monitoring. Blracelest. main (BIracelest. java:20) 
hk hs 














图 4-17 BTrace 跟 踪 结 果 


BTrace 的 用 法 还 有 许多 ， 打 印 调用 堆栈 、 参 数 、 返 回 值 只 是 最 基本 的 应 用 ， 在 它 的 网 站 上 有 使 用 BTrace 进 行 性 能 监视 、 定 位 连接 泄漏 、 内 存 泄漏 、 解 决 多 线程 竞争 问题 等 的 使 用 例子 ， 有 兴趣 的 读者 可 
以 去 网 上 了 解 相 关 信息 。 

















1] VisualVM 官方 站 点 : https://visualvm.dev.java.net/。 

2] 准确 地 说 ， 只 有 虚拟 机 使 用 解释 器 执行 的 时 候 ，“ 在 作用 域 之 内 ”才能 保证 它 不 会 被 回收 ， 因 为 这 里 的 回收 还 涉及 局 部 变量 表 Slot 复 用 、 即 时 编译 器 介入 时 机 等 问题 ， 具 体内 容 可 参考 第 8 章 中 关于 局 部 变 
量 表 内 存 回收 的 例子 。 

3] 默认 值 ， 实 际 值 取决 于 javalangIntegerIntegerCache.high 参数 的 设置 。 

让 早 于 JDK1.6 的 平台 ， 需 要 打开 -Dcom.sun.management.jmxremote 参数 才能 被 VisualVM 管理 。 

5] 插件 中 心地 址 : http://java.net/projects/visualvm/content/pluginscenters.html。 

6] 官方 主页 : http://kenai.com/projects/btrace/。 








[7] HotSwap 技 术 : 代码 热 替换 技术 ，HotSpot 虚 拟 机 允许 在 不 停止 运行 的 情况 下 ， 更 新 已 经 加 载 的 类 的 代码 。 


4.4 本章 小 结 


本 章 介绍 了 随 JDK 发 布 的 6 个 命令 行 工具 与 2 个 可 视 化 的 故障 处 理工 具 ， 灵 活 使 用 这 些 工具 ， 可 以 给 处 理 问题 带 来 很 大 的 便利 。 








除了 JDK 自 带 的 工具 之 外 ， 常 用 的 故障 处 理工 具 还 有 很 多 ， 如 果 读 者 使 用 的 是 非 Sun 系 列 的 JDK， 非 HotSpot 的 虚拟 机 ， 就 需要 使 用 对 应 的 工具 进行 分 析 ， 如 : 








“ IBM 的 Support Assistant!!| 、Heap Analyzerl |、Javacore Analyzer | 、Garbage Collector Analyzerl 咱 适用 于 IBM J9VM。 

: HP 的 HPjmeter、HPjtune 适 用 于 HP-UX、SAP、HotSpot VM。 

: Eclipse 的 Memory Analyzer Toolldl (MAT) 适用 于 HP-UX、SAP、HotSpot VM， 安 装 TBM DTFJI1 插 件 后 可 支持 IBM J9VM。 
: BEA 的 JRockit Mission Controll 站 ， 适 用 于 JRockit VM。 


[1] http://www-01.ibm.com/software/support/isa/ 。 

[2] http://www.alphaworks.ibm.com/tech/heapanalyzer/download。 
[3] http://www.alphaworks.ibm.com/tech/jca/ download。 

[4] http://www.alphaworks.ibm.com/tech/pmat/download。 


[5] https: 0392.www2.hp.com/ portal/ swdepot/displayProductInfo.do?productNumber=HPJMETER.。 
https://h2 hp. /portal/swdepot/ displ: di fo.do?prod bt TE) 


[6] http://www.eclipse.org/ mat/ 。 


[7] http://www.ibm.com/ developerworks/java/jdk/tools/dtfj.html。 


[8] http://download.oracle.com/docs/cd/E13150_01/jrockit_jvm/jrockit/tools/index.html。 


第 5 章 ” 调 优 案例 分 析 与 实战 


本 章 主要 内 容 
“概述 
“ 案例 分 析 


: 实战 : Eclipse 运行 速度 调 优 


Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 转 


5.1 概述 


前 面 三 章 介绍 了 处 理 








拟 机 故障 处 理 和 调 优 主要 面向 各 类 服务 端 应 





得 故障 处 理 和 调 优 的 经 验 。 


5.2 ”案例 分 析 









































本 章 中 的 案例 大 部 分 来 源 于 笔者 处 理 过 的 一 些 问题 ， 还 有 一 小 部 分 来 源 于 网 上 有 特色 和 代表 性 的 案例 总 结 。 











做 了 一 些 屏蔽 和 精简 。 





5.2.1 


一 个 15 万 PV/ 天 左右 的 在 线 文档 类 型 网 站 最 近 更 换 了 硬件 系统 ， 新 的 硬件 为 4 个 CPU、16GB 物 理 内 存 ， 操 作 系 统 为 64 位 CentOS 5.4，Resin 作 为 Web 服 务 器 。 整 个 服务 器 暂时 没有 部 署 别 的 应 用 ， 


高 性 能 硬件 上 的 程序 部 署 策略 


， 而 大 部 分 Java 程 序 员 较 少 有 机 会 直接 接触 生产 环境 的 服务 器 ， 


成 的 高 墙 ， 墙 外 面 

















的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 





ava 虚 拟 机 内 存 问题 的 知识 与 工具 ， 在 处 理 实际 项 目的 问题 时 ， 除 了 知识 与 工具 外 ， 经 验 也 是 一 个 很 














要 的 





素 。 





此 本 




















硬件 资源 都 可 以 提供 给 访问 量 并 不 算 太 大 的 网 站 使 


经 常 不 定期 出 现 长 时 间 没有 响应 的 现象 。 














。 管 理 员 为 了 尽量 利 


硬件 资源 选 





























监控 服务 器 运行 状况 后 发 现 网 站 没有 响应 是 由 GC 停顿 导致 的 ， 虚 拟 机 
访问 文档 时 要 把 文档 从 磁盘 提取 到 内 存 中 ， 导 致 内 存 中 出 现 很 多 由 文档 序列 化 产生 的 大 对 象 ， 这 些 大 对 象 很 多 都 进入 了 老生 
消耗 列 尽 ， 由 此 导致 每 隔 十 几 分 钟 出 现 十 几 秒 的 停顿 ， 令 网 站 开发 人 员 和 管理 员 感 到 很 诅 形 。 


这 里 先 不 延伸 讨论 程序 代码 问题 ， 程 序 部 署 上 的 
因此 才 考虑 升级 硬件 提升 程序 效能 ， 如 果 午 





明显 的 停顿 ， 








在 高 性 能 硬件 上 部 署 程序 ， 目 前 主要 有 两 种 方式 : 





“ 通过 64 位 JDK 来 使 用 大 内 存 。 


“ 使 用 若干 个 32 位 虚拟 机 建立 逻辑 集群 来 利用 硬件 资源 。 





运行 在 Server 模 式 ， 默 认 使 


了 64 位 的 JDK 1.5， 并 通过 -Xmx 和 -Xms 参 数 将 Java 堆 固定 在 12GB。 使 

















吞吐 量 优先 收集 器 ， 

















要 问题 显然 是 过 大 的 堆 内 存 进行 回收 时 带 来 的 长 时 间 的 停顿 。 硬 件 升级 前 使 
新 缩小 给 Java 堆 分 配 的 内 存 ， 那 么 硬件 上 的 投资 就 浪费 了 。 

















此 案例 中 的 管理 员 采 

















户 使 














控制 Full GC 频 率 的 关键 是 看 应 用 中 绝 大 多 数 对 象 能 否 符合 “ 朝 生 夕 灭 ”的 原则 ， 即 大 多 数 对 象 的 生存 时 间 不 应 当 太 长 ， 尤 












































了 第 一 种 部 署 方式 。 对 于 
， 壁 如 十 几 个 小 时 乃至 一 天 才 出 现 一 次 Full GC， 这 样 可 以 通过 在 深夜 执行 定时 任务 的 方式 触发 Full GC 甚 至 自动 











， 主 要 对 象 的 生存 周期 都 应 该 是 请 求 级 或 页 面 级 的 ， 会 话 级 和 全 





户 交 互 性 强 、 对 停顿 时 间 敏 感 的 系统 ， 可 以 给 java 虚拟 机 分 配 超大 堆 的 前 
启 应 用 有 

















可 收 12GB 的 堆 ， 一 次 Full GC 的 停顿 
F 代 ， 没 有 在 Minor GC 中 清理 掉 。 














出 于 对 客户 商业 信息 保护 的 目的 ， 在 不 影响 前 后 逻辑 的 前 提 下 ， 笔 者 对 实际 环境 和 














一 段 时 间 后 发 现 使 

















将 与 读者 分 享 几 个 比较 有 代表 性 的 实际 案例 。 考 虑 到 虚 
因此 本 章 还 准备 了 一 个 所 有 开发 人 员 都 能 够 进行 “亲身 实战 ”的 练习 ， 希 望 通过 实践 使 读者 获 











户 业 务 























所 有 


























效果 并 不 理想 ， 网 站 








时 间 高 达 14 秒 。 


并 且 


由 于 程序 设计 的 关系 ， 














这 和 








提 是 有 把 握 把 应 
肛 务 器 来 将 内 存 可 用 空间 保持 在 一 个 稳定 的 水 平 。 





























64 位 JDK 来 管理 大 内 存 ， 还 需要 考虑 下 面 可 能 





局 级 的 长 生命 对 象 相对 很 少 。 只 要 代码 写 
临 的 问题 : 





[县 和 全- 
和 体 僻 








程序 的 Full GC 频率 控制 得 足够 低 ， 





情况 下 即使 有 12GB 的 堆 ， 内 存 也 很 快 会 被 


32 位 系统 1.5GB 的 堆 ， 用 户 只 感到 访问 网 站 比较 缓慢 ， 但 不 会 发 生 十 分 


至 少 要 低 到 不 会 影响 用 


是 不 能 产生 成 批量 的 、 长 生存 时 间 的 大 对 象 ， 这 样 才能 保障 老年 代 空 间 的 稳 











理 ， 应 当 都 能 实现 在 超大 堆 中 正常 使 











“ 需要 保证 程序 足够 稳定 ， 因 为 这 种 应 用 要 是 产生 堆 溢出 几乎 就 无 法 产生 堆 转 储 快照 (因为 要 产生 十 几 GB 乃至 更 大 的 dump 文 件 ) ， 哪 怕 产 生 了 快照 也 几乎 无 法 进行 分 析 。 














定 。 
在 大 多 数 网 站 形式 的 应 用 里 
话 ， 使 用 超大 堆 内 存 时 ， 网 站 响应 的 速度 才 比较 有 保证 。 除 此 之 外 ， 如 果 读 者 计划 使 
“内存 回 收 导 致 的 长 时 间 停 顿 。 
“ 现 阶 段 ，64 位 JDK 的 性 能 测试 结果 普遍 低 于 32 位 JDK。 
“ 相同 的 程序 在 64 位 JDK 中 消耗 的 内 存 一 般 比 32 位 JDK 大 ， 这 是 由 指针 膨胀 及 数 
上 面 的 问题 听 起 来 有 点 
器 进程 分 配 不 同 的 端口 ， 然 
多 应 用 中 前 端的 均衡 器 总 是 要 存在 的 。 




















考虑 到 在 一 台 物 理 机 器 上 建立 逻辑 集群 的 
Session 复 制 的 亲 合式 集群 是 一 个 相当 不 错 的 选择 。 我 们 仅仅 需要 保障 集群 具备 亲 和 性 ， 也 就 是 均衡 器 按 一 定 的 规则 算法 (一 般 根据 Session1D 分 配 ) 将 一 个 固定 的 有 
进行 处 理 即 可 ， 这 样 程序 开发 阶段 就 基本 不 








下 人 ， 所 以 现 阶 段 不 少 管理 员 还 是 选择 第 二 种 方式 : 使 
后 在 前 端 搭建 一 个 负载 均衡 器 ， 以 反 向 代理 的 方式 来 分 配 访问 请 求 。 读 者 不 需要 太 在 意 均衡 器 转发 所 消耗 的 性 能 ， 即 使 使 


据 类 型 对 齐 补 白 等 因素 导致 的 。 





























厂 

















个 32 位 虚拟 机 建立 逻辑 集群 来 利 








硬件 资源 。 


体 做 法 是 在 一 台 物理 机 器 上 启动 多 个 应 
64 位 JDK， 许 多 应 用 也 不 止 有 一 台 服 务 器 ， 因 此 在 许 















































目的 仅仅 是 尽 可 能 地 利 














硬件 资源 ， 并 不 需 


关心 状态 保留 、 热 转移 之 类 的 高 可 











性 需求 ， 也 不 需 






































为 集群 环境 做 什么 特别 的 

















保证 每 个 虚拟 机 进程 有 绝对 准确 的 均衡 负载 ， 


而 没有 Full GC， 这 样 的 


服务 器 进程 ， 给 每 个 服务 














因此 使 用 无 
































户 请 求 永远 分 配 到 固定 的 一 个 集群 节点 




















当然 ， 很 少 有 没有 缺点 的 方案 ， 如 果 读 者 计划 使 








逻辑 集群 的 方式 来 部 署 程序 ， 可 能 会 遇 到 下 面 一 些 问题 : 





“ 尽量 避免 节点 竞争 全 局 的 资源 ， 最 典型 的 就 是 磁盘 竞争 ， 各 个 节点 如 果 同 时 访问 菜 个 磁盘 文件 的 话 ( 尤 其 是 并 发 写 操作 容易 出 现 问题 ) ， 很 容易 导致 ID 异常 。 


. 很 难 最 高 效率 地 利用 革 些 资源 地， 局 如 连接 池 ， 一 般 都 是 在 各 个 节点 建立 自己 独立 的 连接 池 ， 这 样 有 可 能 导致 一 些 节点 池 满 了 而 另外 一 些 节点 仍 有 较 多 空余 。 
定 的 复杂 性 并 且 可 能 带 来 额外 的 性 能 代价 。 


尽管 可 以 使 


用 集中 式 的 JNDI， 但 这 有 一 


“ 各 个 节点 仍然 不 可 避免 地 受到 32 位 的 内 存 限 制 ， 在 32 位 Windows 平 台中 每 个 进程 只 能 使 用 2GB 的 内 存 ， 考 虑 到 堆 以 外 的 内 存 开销 ， 堆 一 般 最 多 只 能 开 到 1.5GB。 在 某 些 Linux，Unix 系 统 〈( 如 Solatis) 


中 ， 可 以 提升 到 3GB 乃 至 接近 4GB 的 内 存 , 但 32 位 中 仍然 受 最 高 4GB (232) 内 存 的 限制 。 


“ 大 量 使 用 本 地 缓存 (如 大 量 使 用 HashMap 作 为 K/V 缓 存 ) 的 应 用 ， 在 逻辑 集群 中 会 造成 较 大 的 内 存 浪费 ， 因 为 每 个 逻辑 节点 上 都 有 一 份 缓存 ， 这 时 可 以 考虑 把 本 地 缓存 改 为 集中 式 缓存 。 























介绍 完 这 两 种 部 署 方式 ， 再 重新 回 到 这 个 案例 之 中 ， 最 后 的 部 署 方案 调整 为 建立 5 个 32 位 JDK 的 逻辑 集群 ， 每 个 进程 按 2GB 内 存 计算 (其 中 堆 
Apache 服 务 作为 前 端 均衡 代理 访问 门户 。 考 虑 到 用 户 对 响应 速度 比较 关心 ， 并 且 文 档 服务 的 主要 压力 集中 在 磁盘 和 内 存 访问 上 ，CPU 资 源 敏感 度 较 低 ， 因 
后 ， 服 务 再 没有 出 现 长 时 间 停 顿 ， 速 度 比 硬件 升级 前 有 较 大 提升 。 








固定 为 1.5GB) ， 占 





























5.2.2 ”集群 间 同 步 导 致 的 内 存 溢出 


一 个 基于 B/S 的 MIS 系 统 ， 硬 件 为 两 台 2 个 CPU、8GB 内 存 的 HP 小 型 机 ， 服 务 器 是 WebLogic 9.2， 每 台 机 器 启动 了 3 个 WebLogic 实 例 ， 构 成 一 个 6 个 节点 的 亲 合 式 集 群 。 由 了 


了 10GB 的 内 存 。 另 外 建立 一 个 
此 改 为 CMS 收 集 器 进行 垃圾 回收 。 部 署 方 式 调整 

















有 进行 Session 同 步 ， 但 是 有 一 些 需 求 要 实现 部 分 数据 在 各 个 节点 间 共 享 。 开 始 这 些 数 据 存 放 在 数据 库 中 ， 但 由 于 读 写 频繁 竞争 很 激烈 ， 对 性 能 的 影响 较 大 ， 后 面 使 F 
局 缓存 启用 后 ， 服 务 正常 使 用 了 较 长 的 一 段 时 间 。 但 最 近 不 定期 地 多 次 出 现 内 存 溢出 问题 。 








HI 
























































在 不 出 现 内存 溢 出 异常 的 时 候 ， 服 务 内 存 回收 状况 一 直 正 常 ， 每 次 内 存 回收 后 都 能 恢复 到 一 个 稳定 的 可 
更 新 或 升级 过 ， 也 没有 进行 什么 特别 的 操作 。 只 好 让 服务 带 着 -XX: +HeapDumpOnOutOfMemoryError 人 参数 
量 的 org.jgroups.protocols.pbcast.NAKACK 对 象 。 











空间 ， 开 始 怀疑 是 程序 的 某 些 不 常 


运行 了 一 段 时 间 。 在 最 近 一 次 溢出 之 后 ， 管 理 员 发 回 














了 heapdum 

















JBossCache 是 基于 自家 的 JGroups 进 行 集群 间 的 数据 通信 ，JGroups 使 
中 的 NAKACK 栈 用 于 保障 各 个 包 的 有 效 顺序 及 重 发 。JBossCache 协 议 栈 如 





协议 栈 的 方式 来 实现 收发 数据 包 的 各 种 所 需 特 性 的 
5-1 所 示 。 
































emon Thread [DownHandler (VIEW SYHC)] (Suspended (breakpoint at line 401 
HAKACK. down (Event) line: 401 

HAFACK (Frotocol). receiveDownEvent (Event) line: S17 
UNICAST (Frotocol). passDown (Event) line: 551 
UNICAST. down (Event) line: 355 

UNICAST (Frotocol). receivelownEvent (Event) line: S17 
STABLE (Frotocol). passlown (Event) line: 551 
STABLE. down (Event) line: 283 

STABLE (Frotocol). receiveDownEvent (Event) line: S17 
FRAG (Frotocol). passDown (Event) line: 551 
FRAG. down (Event) line: 139 

FRAG (Frotocol). receivelownEvent (Event) line: S17 
VIEW SYHC (Frotocol). passlown (Event) line: 551 

VIEW SYHC. down (Event) line: 1BB 

DownHandler. runl) line: 121 


Da 


图 5-1 JBossCache 协 议 栈 


由 于 信息 有 传输 失败 需要 重 发 的 可 能 性 ， 在 确认 所 有 注册 在 GMS (Group Membership Service) 的 节点 都 收 到 正确 的 信息 前 ， 发 送 的 信息 必须 在 内 存 中 保留 。 而 此 MIS 的 
给 的 全 局 Filter， 每 当 接收 到 请 求 时 ， 均 会 更 新 一 次 最 后 的 操作 时 间 ， 并 且 将 这 个 时 间 同步 到 所 有 的 节点 中 ， 使 得 一 个 用 户 在 一 段 时 间 内 不 能 在 多 台 机 器 上 登录 。 在 服务 使 
次 乃至 数 十 次 的 请 求 ， 因 此 这 个 过 滤器 导致 集群 各 个 节点 之 间 的 网 络 交互 非常 频繁 。 当 网 络 情况 不 能 满足 传输 要 求 时 ， 重 发 数据 在 内 存 中 不 断 地 堆积 ， 很 快 就 产生 了 内 存 溢出 。 

































































本 








这 个 案例 中 的 问题 ， 既 有 . 
类 被 集群 共享 的 数据 如 果 要 使 
来 很 大 的 网 络 同步 的 开销 。 


BossCache 的 缺陷 ， 也 有 MI1S 系 统 实现 方式 上 的 缺陷 。JBossCache 官 方 的 maillist 中 讨论 过 很 多 次 类 似 的 内 存 溢 出 异常 问题 ， 据 说 后 续 版 本 有 了 改 
类 似 JBossCache 这 种 集群 缓存 来 同步 的 话 ， 可 以 允许 读 操作 频繁 ， 因 为 数 地 


























5.2.3 “” 堆 外 内 存 导致 的 溢出 错误 











这 是 一 个 学 校 的 小 型 项 目 : 基于 B/S 的 电子 考试 系统 ， 为 了 实现 客户 端 能 实时 地 从 服务 端 接收 考试 数据 ， 系 统 使 F 
端 推送 框架 ， 服 务 器 是 Jetty 7.1.4， 硬 件 为 一 台 普 通 PC 机 ，Core i5CPU，4GB 内 存 ， 运 行 32 位 Windows 操 作 系统 。 








了 北向 AJAX 技 术 (也 称 为 Comet 或 Server Side Push) ， 





JBossCache 构 建 了 一 个 全 


的 代码 路 径 中 存在 内 存 泄漏 ， 但 管理 员 





过 程 中 ， 往 往 一 个 页 


居 在 本 地 内 存 有 一 份 副 本 ， 读 取 的 动作 不 会 耗费 多 少 资源 ， 但 不 应 当 有 过 于 频繁 


是 亲 合式 集群 ， 节 点 之 间 没 
局 缓存 。 全 








反映 最 近 程 序 并 未 
存在 着 大 














p 文 件 ， 发 现 里 


由 组 合 ， 数 据 包 接收 和 发 送 时 要 经 过 每 层 协议 栈 的 up0 和 down() 方 法 ， 其 


in HAKACK)) 


服务 端 中 有 一 个 负责 安全 校 
会 产生 数 








3 














进 。 而 更 重要 的 缺陷 是 这 一 
的 写 操作 ， 这 会 带 














选用 CometD 1.1.1 作 为 服务 




















测试 期 间 发 现 服务 端 不 定时 抛 出 内 存 溢出 异常 ， 服 务 器 不 一 定 每 次 都 会 出 现 异常 ， 但 假如 正式 考试 时 崩溃 一 次 ， 那 估计 整 场 电子 考试 都 会 乱 套 ， 网 站 管理 员 尝 试 过 把 堆 开 到 最 大 ，32 位 系统 最 多 到 




















1.6GB 基 本 无 法 再 加 大 了 ， 而 且 开 大 了 也 基本 没 效 果 ， 抛 出 内 存 溢出 异常 好 像 更 加 频繁 了 。 加 入 -XX: +HeapDumpOnOutOfMemoryError， 


居然 也 没有 任何 反应 ， 抛 出 内 存 溢出 异常 时 什么 文件 都 没有 产 











生 。 无 奈 之 下 只 好 挂 着 jstat 使 劲 盯 屏 幕 ， 发 现 GC 并 不 频繁 ，Eden 区 、Survivor 区 、 老 生 
内 存 溢出 后 从 系统 日 志 中 找到 异常 堆栈 ， 如 代码 清单 5-1 所 示 。 


F 代 及 永久 代 内 存 全 部 都 表示 “情绪 稳定 ， 压 力 不 大 ”， 但 照样 不 停 地 抛 出 内 存 溢出 异常 ， 








代码 清单 5-1 异常 堆栈 1 


管理 员 压 力 很 大 。 最 后 ， 在 





[org.eclipse.jetty.util.1og]l handle failed java.lang.OutOfMemoryError: null 
at sun.misc.Unsafe.allocateMemory (Native Method) 
at java.nio.DirectByteBuffer.<init> (DirectByteBuffer.java:99) 
at java.nio.ByteBuffer.allocateDirect (ByteBuffer.java:288) 
at org.eclipse.jetty.io.nio.DirectNIOBuffer.<init> 



































如 果 认 真 阅读 过 本 书 的 第 2 章 ， 看 到 异常 堆栈 就 应 该 清楚 这 个 内 存 溢出 异常 是 怎么 回 事 了 。 大 家 知道 操作 系统 对 每 个 进程 能 管理 的 内 存 是 有 限制 的 ， 这 人 台 服 务 器 使 用 的 32 位 Windows 平 台 的 限制 是 
2GB， 其 中 给 了 Java 推 1.6GB， 而 Direct Memory 并 不 算 在 1.6GB 的 堆 之 内 ， 因 此 它 只 能 在 剩余 的 0.4GB 空 间 中 分 出 一 部 分 。 在 此 应 用 中 导致 溢出 的 关键 是 : 垃圾 收集 进行 时 ， 虚 拟 机 虽然 会 对 Direct 
Memory 进 行 回收 ,但 是 Direct Memory 却 不 能 像 新 生 代 和 老年 代 那 样 ， 发 现 空间 不 足 了 就 通知 收集 器 进行 垃圾 回收 ， 它 只 能 等 待 老年 代 满 了 后 Full GC， 然 后 “顺便 地 ” 帮 它 清理 掉 内 存 的 废弃 对 象 。 否 
则 ， 它 只 能 等 到 抛 出 内 存 溢出 异常 时 ， 先 catch 掉 ， 再 在 catch 块 里 面 “ 大 喊 ”一 声 : “System.gc0! ”。 要 是 虚拟 机 还 是 不 听 (譬如 打开 了 -XX: +DisableExplicitGC 开 关 ) ， 那 就 只 能 眼睁睁 地 看 着 堆 中 
还 有 许多 空闲 内 存 ， 自 己 却 不 得 不 抛 出 内 存 溢出 异常 了 。 而 本 案例 中 使 用 的 CometD 1.1.1 框 架 ， 正 好 有 大 量 的 NIO 操 作 需 要 用 到 Direct Memory。 
















































































从 实践 经 验 的 角度 出 发 ， 除 了 Java 堆 和 永久 代 之 外 ， 我 们 注意 到 下 面 这 些 区 域 还 会 占用 较 多 的 内 存 ， 这 里 所 有 的 内 存 总 和 会 受到 操作 系统 进程 最 大 内 存 的 限制 : 




















“ Direct Memory: 可 通过 -XX: MaxDirectMemorySize 调 整 大 小 ， 内 存 不 足 时 抛 出 OutOfMemoryError 或 OutOfMemoryError: Direct buffer memory。 


' 线程 堆栈 : 可 通过 -Xss 调 整 大 小 ， 内 存 不 足 时 抛 出 StackOverflowError (纵向 无 法 分 配 ， 即 无 法 分 配 新 的 栈 帧 ) 或 OutOfMemoryError: unable to create new native thread (横向 无 法 分 配 ， 即 无 法 建立 新 的 
线程 ) 。 


“ Socket 缓 存 区 : 每 个 Socket 连 接 都 Receive 和 Send 两 个 缓存 区 ， 分 别 占 大 约 37KB 和 25KB 的 内 存 ， 连 接 多 的 话 这 块 内 存 占 用 也 比较 可 观 。 如 果 无 法 分 配 ， 则 可 能 会 抛 出 IJOException: Too many open files 异 


“内 I 代码 : 如 果 代码 中 使 用 NI 调用 本 地 库 ， 那 本 地 库 使 用 的 内 存 也 不 在 堆 中 。 


“ 虚拟 机 和 GC: 虚拟 机 和 GC 的 代码 执行 也 要 消耗 一 定 的 内 存 。 


5.2.4 “外 部 命令 导致 系统 缓慢 








这 是 一 个 来 自 网 络 的 案例 : 一 个 数字 校园 应 用 系统 ， 运 行 在 一 台 4 个 CPU 的 Solaris 10 操 作 系统 上 ， 中 间 件 为 GlassFish 服 务 器 。 系 统 在 进行 大 并 发 压力 测试 的 时 候 ， 发 现 请 求 响应 时 间 比 较 慢 ， 通 过 操作 
系统 的 mpstat 工 具 发 现 CPU 使 用 率 很 高 ， 并 且 占 用 绝 大 多 数 CPU 资源 的 程序 并 不 是 应 用 系统 本 身 。 这 是 个 不 正常 的 现象 ， 通 常情 况 下 用 户 应 用 的 CPU 占用 率 应 该 占 主要 地 位 ， 才 能 说 明 系统 是 正常 工作 的 。 








































































































通过 Solaris 10 的 Dtrace 脚 本 可 以 查看 当前 情况 下 哪些 系统 调用 花费 了 最 多 的 CPU 资源 ，Dtrace 运 行 后 发 现 最 消耗 CPU 资源 的 竟然 是 “fork” 系 统 调 用 。 众 所 周知 ，“fork” 系统 调 用 是 Linux 用 来 产生 
新 进程 的 ， 在 Java 虚 拟 机 中 ， 用 户 编写 的 Java 代 码 最 多 只 有 线程 的 概念 ， 不 应 当 有 进程 的 产生 。 



























































这 是 个 非常 异常 的 现象 。 通 过 本 系统 的 开发 人 员 最 终 找到 了 答案 : 每 个 用 户 请 求 的 处 理 都 需要 执行 一 个 外 部 shell 脚 本 来 获得 系统 的 一 些 信息 。 执 行 这 个 shell 脚 本 是 通过 Java 的 
Runtime.getRuntime().exec() 方 法 来 调用 的 。 这 种 调用 方式 可 以 达到 目的 ， 但 是 它 在 Java 虚 拟 机 中 非常 消耗 资源 ， 即 使 外 部 命令 本 身 能 很 快 执行 完毕 ， 频 繁 调用 时 创建 进程 的 开销 也 非常 可 观 。Java 虚 拟 机 
执行 这 个 命令 的 过 程 是 : 首先 克隆 一 个 和 当前 虚拟 机 拥有 一 样 环 境 变量 的 进程 ， 再 用 这 个 新 的 进程 去 执行 外 部 命令 ， 最 后 再 退出 这 个 进程 。 如 果 频 繁 执行 这 个 操作 ， 系 统 的 消耗 会 很 大 ， 不 仅 是 CPU， 内 存 
的 负担 也 很 










































































| 四 
ll 























户 根据 建议 去 掉 这 个 shell 脚 本 执行 的 语句 ， 改 为 使 用 Java 的 API 去 获取 这 些 信息 后 ， 系 统 很 快 就 恢复 了 正常 。 


























5.2.5 “服务 器 JVM 进 程 崩溃 


一 个 基于 B/S 的 MIS 系 统 ， 硬 件 为 两 全 2 个 CPU、8GB 内 存 的 HP 系统 ， 服 务 器 是 WebLogic 9.2 (就 是 第 二 个 案例 中 的 那 套 系统 ) 。 正 常 运行 一 段 时 间 后 ， 最 近 发 现在 运行 期 间 频 繁 出 现 集群 节点 的 虚拟 
机 进程 自动 关闭 的 现象 ， 留 下 了 一 个 hs_err_pid###.log 文 件 后 ， 进 程 就 消失 了 ， 两 台 物理 机 器 里 的 每 个 节点 都 出 现 过 进程 崩溃 的 现象 。 从 系统 日 志 中 注意 到 ， 每 个 节点 的 虚拟 机 进程 在 崩溃 前 不 久 ， 都 发 生 
过 大 量 相同 的 异常 ， 见 代码 清单 5-2。 


























代码 清单 5-2 异常 堆栈 2 





java.net.SocketException: Connection reset 

at java.net.SocketInputStream.read (SocketInputStream.java:168) 

at java.io.BufferedIinputStream.fill (BufferedIinputStream.java:218) 

at java.io.BufferedInputStream.read (BufferedIinputStream.java:235) 

at org.apache.axis.transport.http.HTTPSender.readHeadersFromSocket (HTTPSender .java:583) 

at org.apache.axis.transport.http.HTTPSender.invoke (HTTPSender .java:143) 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 99 more 











这 是 一 个 远 端 断 开 连 接 的 异常 ， 通 过 系统 管理 员 了 解 到 系统 最 近 与 一 个 OA 门户 做 了 集成 ， 在 MIS 系 统 工作 流 的 待 办 事项 变化 时 ， 要 通过 Web 服 务 通知 OA 门户 系统 ， 把 待 办 事项 的 变化 同步 到 OA 门户 之 
中 。 通 过 SoapUI 测 试 了 一 下 同步 待 办 事项 的 几 个 Web 服 务 ， 发 现 调用 后 竟然 需要 长 达 3 分 钟 才能 返回 ， 并 且 返 回 的 结果 都 是 连接 中 断 。 







































































由 于 MIS 系统 的 用 户 多 ， 待 办 事项 变化 很 快 ， 为 了 不 被 OA 系统 的 速度 拖累 ， 使 用 了 异步 的 方式 调用 Web 服 务 ， 但 由 于 两 边 服务 的 速度 完全 不 对 等 ， 时 间 越 长 就 累积 了 越 多 Web 服 务 没有 调用 完成 ， 导 
致 在 等 待 的 线程 和 Socket 连 接 越 来 越 多 ， 最 终 超过 虚拟 机 的 承受 能 力 后 使 得 虚拟 机 进程 崩 演 。 通 知 OA 门户 方 修复 无 法 使 用 的 集成 接口 ， 并 将 异步 调用 改 为 生产 者 /消费 者 模式 的 消息 队列 实现 后 ， 系 统 恢 


正常 。 




























































































5.3 ”实战 ;Eclipse 运行 速度 调 优 




















很 多 Java 开 发 人 员 都 有 这 样 一 种 观念 : 系统 调 优 的 工作 都 是 针对 服务 端 应 用 而 言 的 ， 规 模 越 大 的 系统 ， 需 要 越 专业 的 调 优 运 维 团队 参与 。 这 个 观点 不 能 说 不 对 ， 上 一 节 中 笔者 所 列举 的 案例 确实 都 是 服 
务 端 运 维和 调 优 的 例子 ， 但 服务 端 应 用 需要 调 优 ， 并 不 说 明 其 他 应 用 就 不 需要 了 ， 作 为 一 个 普通 的 Java 开 发 人 员 ， 前 面 讲 的 各 种 虚拟 机 的 原理 和 最 佳 实践 的 方法 距离 我 们 并 不 遥远 ， 开 发 者 身边 的 很 多 场景 
都 可 以 使 用 上 面 这 些 知识 。 下 面 就 通过 一 个 普通 程序 员 日 常 工 作 中 可 以 随时 接触 到 的 开发 工具 开始 这 次 实战 。 






















































































5.3.1 ， 调 优 前 的 程序 运行 状态 
































笔者 使 用 Eclipse 3.5 作 为 日 常 工作 中 的 主要 IDE 工 具 ， 由 于 安装 的 插件 比较 大 (如 Klocwork、ClearCase LT 等 ) 、 代 码 也 很 多 ， 启 动 Eclipse 直到 所 有 项 目 编译 完成 需要 四 五 分 钟 。 一 直 对 开发 环境 的 速 
度 感到 不 满意 ， 趁 着 编写 这 本 书 的 机 会 ， 决 定 对 Eclipse 进行 “ 动 刀 ” 调 优 。 






































笔者 机 器 的 Eclipse 运行 平台 是 32 位 Windows 7 系统 ， 虚 拟 机 为 HotSpot VM 1.5b64， 硬 件 为 ThinkPad X201，Intel i5CPU，4GB 物 理 内 存 。 在 初始 的 配置 文件 eclipse.ini 中 ， 除 了 指定 JDK 的 路 径 、 设 
置 最 大 堆 为 512MB 及 开启 了 JMX 管 理 (需要 在 VisualVM 中 收集 原始 数据 ) 外 ， 未 作 任何 改动 ， 原 始 配置 内 容 如 代码 清单 5-3 所 示 。 

















代码 清单 5-3 ”Eclipse 3.5 初 始 配置 





—wm 
D:/_DevSpace/jdk1.5.0/bin/javaw.exe 

-startup 

plugins/org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
--launcher.library 
plugins/org.eclipse.equinox.launcher.win32.win32.x86 1.0.200.v20090519 
-product 

org.eclipse.epp.package.jee.product 

—-launcher .XXMaxPermSize 

256M 

-showsplash 

org.eclipse.platform 

—vmargs 

-Dosgi.requiredJavaVersion=1.5 

—Xmx512m 

-Dcom. sun.management .jmxremote 





为 了 与 调 优 后 的 结果 进行 量化 对 比 ， 调 优 开始 前 笔者 先 做 了 一 次 初始 数据 测试 。 测 试用 例 很 简单 ， 就 是 收集 从 Eclipse 启动 开始 ， 直 到 所 有 插件 加 载 完成 为 止 的 总 耗 时 及 运行 状态 数据 ， 虚 拟 机 的 运行 数 
据 通过 VisualVM 及 其 扩展 插件 VisualGC 进 行 采集 。 测 试 过程 中 反复 启动 Eclipse 数 次 直到 测试 结果 稳定 后 ， 取 最 后 一 次 运行 的 结果 作为 数据 样本 (为 了 避免 操作 系统 未 能 及 时 进行 磁盘 缓存 而 产生 的 影 
响 ) ， 数 据 样本 如 图 5-2 所 示 。 
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[Survivor 0 (3.938N, 1.250M): 0 


bk kA 本 本 本 本 本 加 多 








FSurvivor 1 (3.938N, 1.250NM): 0 
i 吕 中 


[01d Gen (472.625NM, 155.785M): 93. 470N，19 collections, 3.166s 下 


rrPerm Gen (256. 000N, 46.000N): 45.84086 一 四 
pp | 
Eclipse 启动 的 总 耗 时 没有 办 法 从 监控 工具 中 直接 获得 ， 因 为 VisualVM 不 可 能 知道 Eclipse 运行 到 什么 阶段 才 算 是 启动 完成 。 为 了 保证 测试 的 准确 性 ， 笔 者 写 了 一 个 简单 的 Eclipse 插件 ， 用 于 统计 Eclipse 


的 启动 耗 时 。 由 于 代码 很 简单 ， 并 且 本 书 不 是 Eclispe RCP 的 开发 教程 ， 所 以 只 列 出 代码 清单 5-4 供 读者 参考 ， 不 再 延伸 讲解 。 如 果 读 者 需要 这 个 插件 ， 可 以 使 用 下 面 的 代码 自己 编译 或 者 发 E-mail 给 笔者 索 
取 。 



































图 5-2 ”Eclipse 原始 运行 数据 








代码 清单 5-4 ”Eclipse 启动 耗 时 统计 插件 





ShowTime .java 代 码 : 
import org.eclipse.jface.dialogs.MessageDialog; 
import org.eclipse.swt.widgets.Display; 
import org.eclipse.swt .widgets.Shell; 
import org.eclipse.ui.IStartup; 
和 


* 统计 Eclipse 启 动 耗 时 
* Q@author zzm 
二 下 
Public class ShowTime implements IStartup { 
public void earlyStartup () { 
Display.getDefault () .syncExec (new Runnable() { 
public void run() { 
long eclipseStartTime = Long.parseLong (System.getProperty ("eclipse. 
startTime")); 
long costTime = System.currentTimeMillis() -~ eclipseStartTime; 
Shell shell = Display.getDefault () .getActiveShell (); 
String message = "Eclipse 启动 耗 时 : " + costTime + "ms"; 
MessageDialog.openInformation (shell, "Information", message); 
} 
1); 
} 


} 
plugin.xml 代 码 : 
<?xml version="]1.0" encoding="UTF-8"?> 
<?eclipse version="3.4"?> 
<plugin> 
<extension 
Point="org.eclipse.ui.startup"> 
<startup class="eclipsestarttime.actions.ShowTime"/> 
</extension> 
</plugin> 








上 述 代码 打包 成 jar 后 放 到 Eclipse 的 plugins 目 录 中 ， 反 复 启动 几 次 后 ， 插 件 显示 的 平均 时 间 稳定 在 15 秒 左右 ， 如 图 5-3 所 示 。 


Eclipse 启 动 耗 时 : 15896ms 





图 5-3 ” 耗 时 统计 插件 运行 效果 

根据 VisualGC 和 Eclipse 插件 收集 到 的 信息 ， 总 结 原始 配置 下 的 测试 结果 如 下 : 
“ 整个 启动 过 程 平均 耗 时 约 15 秒 。 
“ 最 后 一 次 启动 的 数据 样本 中 ， 垃 圾 收集 总 耗 时 4.149 秒 ， 其 中 : 

“ Full GC 被 触发 了 19 次 ， 共 耗 时 3.166 秒 。 

* Minor GC 被 触发 了 378 次 ， 共 耗 时 0.983 秒 。 
“ 加 载 类 9115 个 ， 耗 时 4.114 秒 。 
:JIT 的 编译 时 间 为 1.999 秒 。 


“ 虚拟 机 512MB 的 堆 内 存 被 分 配 为 40MB 的 新 生 代 (31.5MB 的 Eden 空 间 和 2 个 4MB 的 Surviver 空 间 ) 及 472MB 的 老年 代 。 




















客观 地 说 ， 由 于 机 器 硬件 还 不 错 (请 读者 以 2010 年 普通 PC 机 的 标准 来 衡量 ) ，15 秒 的 启动 时 间 其 实 还 在 可 接受 的 范围 以 内 ， 但 是 从 VisualGC 中 反映 的 数据 来 看 ， 主 要 问题 是 非 用 户 程序 时 间 (图 5-2 中 
的 Compile Time、Class Loader Time、GC Time) 非常 高 ， 占 了 整个 启动 过 程 耗 时 的 一 半 以 上 (这 里 存在 少许 夸张 成 分 ， 因 为 如 果 JIT 编 译 等 动作 是 在 后 台 线程 完成 的 ， 用 户 程序 在 此 期 间 也 正常 执行 ， 所 
以 并 没有 占用 一 半 以 上 的 绝对 时 间 ) 。 虚 拟 机 后 台 占 用 太 多 时 间 也 直接 导致 Eclipse 在 启动 后 的 使 用 过 程 中 经 常 有 停顿 的 感觉 ， 所 以 进行 调 优 有 较 大 的 价值 。 











5.3.2 ”升级 JDK 1.6 的 性 能 变化 及 兼容 问题 


对 Eclipse 进行 调 优 的 第 一 步 就 是 先 把 虚拟 机 的 版 本 做 个 升级 ， 希 望 能 先 从 虚拟 机 版 本 上 得 到 一 些 “ 免 费 的 ”性 能 提升 。 


每 次 JDK 的 大 版 本 发 布 时 ， 开 发 商 肯 定 都 会 宣称 虚拟 机 的 运行 速度 比 上 一 版 本 有 了 很 大 的 提高 ， 这 虽然 是 个 广告 性 质 的 宣言 ， 经 常 被 人 从 升级 列表 或 技术 白皮书 中 直接 忽略 过 去 ， 但 从 国内 外 的 第 三 方 
评测 数据 来 看 ， 版 本 升级 在 某 些 方面 确实 带 来 了 一 定 的 性 能 改善 []， 以 下 是 一 个 第 三 方 网 站 对 JDK 1.5、1.6、1.7 三 个 版 本 做 的 性 能 评测 ， 分 别 测试 了 以 下 四 个 用 例外 |: 











: 生成 500 万 个 字符 囊 。 

“ 500 万 次 ArrayList<String> 数 据 揪 入 ， 使 用 第 一 点 生成 的 数据 。 

“ 生成 500 万 个 HashMap<String, Integer> ， 每 个 键 - 值 对 通过 并 发 线程 计算 ， 测 试 并 发 能 力 。 
“ 打印 500 万 个 ArrayList<String> 中 的 值 到 文件 ， 并 重读 回 内 存 。 


三 个 版 本 的 JDK 分 别 运行 这 些 用 例 的 测试 程序 ， 测 试 结果 如 图 5-4 所 示 。 
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图 5-4 JDK 横 向 性 能 对 比 





从 这 4 个 用 例 的 测试 结果 来 看 ，JDK 1.6 比 1.5 有 大 约 15% 的 性 能 提升 ， 尽 管 对 JDK 仅 测试 这 4 个 用 例 并 不 能 说 明 什么 问题 ， 需 要 通过 测试 数据 来 量化 描述 一 个 JDKte| 昌 版 提升 了 多 少 是 很 难 做 到 非常 科学 准 
确 的 〈 要 做 稍微 靠 谱 一 点 的 测试 ， 可 以 使 用 SPECjvm2008B] 来 完成 ， 或 者 把 相应 版 本 的 TCK 欠 中 数 万 个 测试 有 
JDK 版 本 升级 到 1.6Update 21， 升 级 的 最 主要 理由 是 : 本 书 是 基于 JDK 1.6 编 写 的 。 

















例 的 性 能 数据 对 比 一 下 可 能 更 有 说 服 力 ) ， 但 我 还 是 选择 相信 这 次 “ 软 广告 ”性 质 的 测试 ， 把 


与 所 有 小 说 作者 ( 咽 ……. 我 知道 本 书 不 是 小 说 ) 设计 的 故事 情节 一 样 ， 获 得 最 后 的 胜利 之 前 总 是 要 经 历 各 种 各 样 的 挫折 ， 这 次 升级 到 JDK 1.6 之 后 ， 性 能 有 什么 变化 暂且 不 谈 ， 在 使 用 几 分 钟 之 后 ， 笔 者 
的 Eclipse 就 和 前 面 几 个 服务 端的 案例 一 样 “ 不 负 众望 ”地 发 生 了 内 存 溢出 ， 如 图 5-5 所 示 。 





!@: Internal Eror OO i = 


Ar out of memory error has occurred. Consult the “Rurning Eclipse” section 


of the read me file for information on prevertlng this kind of error in the 
future. 


You are recommended to exit the workbench. 


Subsequent errors may happen and may terminate the workbench without 
Warnine. 


See the .log file for more details. 


Do you want to exit the workbench? 

















5-5 Eclipse OutOfMemoryError 








这 次 内 存 溢出 完全 出 乎 笔者 的 意料 : 决定 对 Eclipse 做 调 优 是 因为 速度 慢 ， 但 开发 环境 一 直 都 很 稳定 ， 至 少 没 有 出 现 过 内 存 溢出 的 问题 ， 而 这 次 升级 除了 eclipse.ini 中 的 JVM 路 径 改 了 之 外 ， 还 未 进行 任 
何 运 行 参数 的 调整 ， 进 到 Eclipse 主 界面 之 后 随便 开 了 几 个 文件 居然 就 抛 出 内 存 溢出 异常 了 ， 难 道 JDK 1.6Update21 有 哪个 API 出 现 了 严重 的 泄漏 问题 吗 ? 

















事实 上 并 不 是 JDK 1.6 出 现 了 什么 问题 ， 根 据 前 面 三 章 中 讲解 的 原理 和 工具 ， 我 们 要 查 明 这 个 异常 的 原因 并 且 解 决 它 一 点 也 不 困难 。 打 开 VisualVM ， 监 视 页 签 中 的 内 存 曲线 部 分 ， 如 图 


在 Java 扒 的 监视 曲线 里 ，“ 扒 大 小 ”曲线 与 “使 用 的 堆 ” 曲 线 一 直 都 有 很 大 的 间隔 距离 ， 每 当 两 条 曲线 开始 出 现 互相 靠近 的 趋势 时 ， 
“最 大 堆 ” 曲 线 向 上 是 虚拟 机 内 部 在 进行 堆 扩容 ， 运 行 参数 中 并 没有 指定 最 小 堆 (-Xms) 的 值 与 最 大 堆 (-Xmx) 相等 ， 所 以 堆 容 量 一 开始 并 没有 扩 


向 。 
“使 用 的 堆 ” 曲 线 向 下 是 因为 虚拟 机 内 部 触发 了 一 次 垃圾 收集 ， 一 些 废弃 对 象 的 空间 被 回收 后 ， 内 存 用 量 相应 减少 ， 从 图 








了 ，“pPermGen 大 小 ”曲线 与 “使 用 的 PermGen” 曲线 几乎 完全 重合 在 一 起 ， 这 说 明永 久 代 中 没有 可 回收 的 资源 ， 所 以 
以 “PermGen 大 小 ”曲线 不 能 向 上 扩展 。 那 么 这 次 很 明显 是 永久 代 导 致 的 内 存 溢出 。 








PermGen 





5-6 和 





图 5-7 所 





“最 大 堆 ” 曲 线 就 会 快速 向 上 转向 ， 而 “使 用 的 堆 ” 曲 线 会 
展 到 最 大 值 ， 而 是 根据 使 用 情况 进行 伸缩 扩 
形 上 看 ，Java 堆 运作 是 完全 正常 的 。 但 永久 代 的 监视 曲线 就 很 有 问题 

“使 用 的 PermGen” 曲线 不 会 向 下 发 展 ， 永 久 代 中 也 没有 空间 可 以 扩展 ， 所 


向 下 转 
展 。 



































大 小 : 320, 815, 104 个 字 节 已 合用: 129, 489, 808 个 字 节 
最 大 : 536, 870, 912 个 字 节 
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图 5-6 Java 堆 监视 曲线 
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图 5-7 永久 代 监 视 曲 线 























再 注意 看 图 5-7 中 永久 代 的 最 大 容量 : “67，108，864 个 字 节 ” ， 也 就 是 64MB， 这 恰好 是 JDK 在 未 使 用 -XX: MaxPermsize 参 数 明确 指定 永久 代 最 大 容量 时 的 默认 值 ， 无 论 JDK 1.5 还 是 JDK 1.6， 这 个 























默认 值 都 是 64MB。 对 于 Eclipse 这 种 规模 的 Java 程 序 来 说 ，64MB 的 永久 代 内 存 空间 显然 是 不 够 的 ， 溢 出 很 正常 ， 那 为 何在 JDK 1.5 中 没有 发 生 过 溢出 呢 ? 






































在 VisualVM 的 “概述 -JVM 参 数 ”页 签 中 ,分 别 检查 使 用 JDK 1.5 和 JDK 1.6 运 行 Eclipse 时 的 JVM 参 数 ， 发 现 使 用 IDK 1.6 时 只 有 以 下 3 个 JVM 人 参数 ， 如 代码 清单 5-5 所 示 。 


代码 清单 5-5 JDK 1.6 的 Eclipse 运行 期 参数 


-Dcom. sun.management .jmxremote 
-Dosgi .requiredJavaVersion=1.5 
—Xmx512m 




















而 使 用 JDK 1.5 运 行 时 有 4 个 VM 参数， 其 中 多 出 来 的 一 个 正好 就 是 设置 永久 代 最 大 容量 的 -XX: MaxPermsize=256M ， 如 代码 清单 5-6 所 示 。 

















代码 清单 5-6 JDK 1.5 的 Eclipse 运行 期 参数 





-Dcom.sun.management . jmxremote 
-Dosgi.requiredJavaVersion=1.5 
-Xmx512m 

-XX:MaxPermSize=256M 





























为 什么 会 这 样 呢 ? 笔者 从 Eclipse 的 Bug List 网 站 [Pl] 上 找到 答案 : 使 用 JDK 1.5 时 之 所 以 有 永久 代 容 量 这 个 参数 ， 是 因为 在 eclipse.ini 中 存在 “--launcher.XXMaxPermSize 256M” 这 项 设置 ， 当 












































launcher 一 一 Windows 下 的 可 执行 程序 eclipse.exe 检 测 到 是 Eclipse 运 行 在 Sun 公 司 的 虚拟 机 上 的 话 ， 就 会 把 参数 值 转化 为 -XX: MaxPermsize 传 递 给 虚拟 机 进程 ， 因 为 三 大 商用 虚拟 机 中 只 有 Sun 系 列 的 虚 
拟 机 才 有 永久 代 的 概念 ， 即 只 有 HotSpot 虚 拟 机 需要 设置 这 个 参数 ，JRockit 虚 拟 机 和 IBM J9 虚 拟 机 都 不 需要 设置 。 



































2010 年 4 月 10 日 ，Oracle 正 式 完成 了 对 Sun 的 收购 ， 此 后 无 论 是 网 页 还 是 具体 的 程序 产品 ， 提 供 商 都 从 Sun 变 为 了 Oracle， 而 eclipse.exe 就 是 根据 程序 提供 商 判 断 是 否 是 Sun 的 虚拟 机 ， 当 JDK 


























1.6Update21 中 java.exe、javaw.exe 的 “Company” 属 性 从 “Sun Microsystems Inc.” 变 为 “Oracle Corporation” 之 后 ，Eclipse 就 完全 不 认识 这 个 虚拟 机 了 ， 因 此 没有 把 最 大 永久 代 的 参数 传递 过 


去 。 





了 解 原因 之 后 ， 解 决 方案 就 简单 了 ，launcher 不 认识 就 只 好 由 人 来 告诉 它 ， 在 eclipse.ini 中 明确 指定 -XX: MaxPermsize=256M 这 个 参数 就 可 以 了 。 








5.3.3 ”编译 时 间 和 类 加 载 时 间 的 优化 





从 Eclipse 启动 时 间 上 看 ， 升 级 到 JDK 1.6 所 带 来 的 性 能 提升 是 .…… 咽 ?基本 上 没有 提升 ”多 次 测试 的 平均 值 与 JDK 1.5 的 差距 完全 在 实验 误差 范围 之 内 。 























各 位 读者 不 必 失 望 ，Sun JDK 1.6 性 能 白皮书 四 描述 的 众多 相对 于 JDK 1.5 的 提升 不 至 于 全 部 是 广告 ， 虽 然 总 启动 时 间 没有 减少 ， 但 在 查看 运行 细节 的 时 候 ， 却 发 现 了 一 件 很 值得 注意 的 事情 : 在 JDK 1.6 




















中 启动 完 Eclipse 所 消耗 的 类 加 载 时 间 比 JDK 1.5 长 了 接近 一 倍 ， 不 要 看 反 了 ， 这 里 写 的 是 1.6 的 类 加 载 比 1.5 慢 一 倍 ， 测 试 结果 如 代码 清单 5-7 所 示 ， 反 复 测 试 多 次 仍然 是 相似 的 结果 。 


代码 清单 5-7 JDK 1.5 和 1.6 中 的 类 加 载 时 间 对 比 





使 用 JDK 1. 6 的 类 加 载 时 间 ， 

C:\Users\IcyFenix>jps 

3552 

6372 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
6900 Jps 中 
C:\Users\IcyFenix>jstat -class 6372 

Loaded BytesUnloadedBytes Time 

791710190.3 0 0.0 8.18 

使 用 JDK 1.5 的 类 加 载 时 间 : 

C:\Users\IcyFenix>jps 

3552 

7272 Jps 

7216 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
C:\Users\IcyFenix>jstat -class 7216 

Loaded BytesUnloaded Bytes Time 

79029691.2 32.6 4.34 




















在 本 例 中 类 加 载 时 间 上 的 差距 并 不 能 作为 一 个 普遍 性 的 测试 结果 去 说 明 JDK 1.6 的 类 加 载 必然 比 1.5 慢 ， 笔 者 测试 了 自己 机 器 上 的 Tomcat 和 ClassFish 启 动 过程 ， 并 没有 出 现 类 似 的 差距 。 在 国内 最 大 的 

















Java 社 区 中 ， 笔 者 发 起 过 关于 此 问题 的 讨论 [JJ， 从 参与 者 反馈 的 测试 结果 来 看 ， 此 问题 只 在 一 部 分 机 器 上 存在 ， 而 且 JDK 1.6 的 各 个 update 版 之 间 也 存在 很 大 差异 。 





























多 次 试验 后 ， 发 现在 笔者 机 器 上 的 两 个 JDK 进 行 类 加 载 时 ， 字 节 码 验证 部 分 的 耗 时 差距 尤其 严重 。 考 虑 到 实际 情况 : Eclipse 使 用 者 甚 多 ， 它 的 编译 代码 我 们 认为 是 可 靠 的， 不 需要 在 加 载 的 时 候 再 进行 




















字 节 码 验 证 ， 因 此 通过 参数 -Xverify: none 禁 止 掉 字 节 码 验证 过 程 也 可 作为 一 项 优化 措施 。 加 入 这 个 参数 后 ， 两 个 版 本 的 JDK 类 加 载 速度 都 有 所 提高 ，JDK 1.6 的 类 加 载 速度 仍然 比 1.5 慢 ， 但 是 两 者 的 耗 时 已 
经 接近 了 许多 ， 测 试 数据 如 代码 清单 5-8 所 示 。 关 于 类 与 类 加 载 的 话题 ， 璧 如 刚刚 提 到 的 字 节 码 验证 是 怎么 回 事 ， 本 书 专门 规划 了 两 个 章节 进行 详细 讲解 ， 在 此 不 再 延伸 。 











代码 清单 5-8 JDK 1.5 和 1.6 中 取消 字 节 码 验 证 后 的 类 加 载 时 间 对 比 








使 用 JDK 1. 6 的 类 加 载 时 间 ， 
C:\Users\IcyFenix>jps 
5512 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 


5596 Jps 
C:\Users\IcyFenix>jstat -class 5512 
LoadedBytes UnloadedBytes Time 


67498837.00 0.0 3.94 

使 用 JDK 1.5 的 类 加 载 时 间 : 

C:\Users\IcyFenix>jps 

4724 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 


5412 Jps 

C:\Users\IcyFenix>jstat -class 4724 
LoadedBytes Unloaded Bytes Time 
68859109.7 3 汪汪 3.10 














在 取消 字 节 码 验证 之 后 ，JDK 1.5 的 平均 启动 时 间 降 到 了 13 秒 ， 而 JDK 1.6 的 测试 数据 平均 比 JDK 1.5 快 1 秒 ， 平 均 下 降 到 12 秒 左右 ， 如 图 5-8 所 示 。 在 类 加 载 时 间 仍然 落后 的 情况 下 ， 依 然 可 以 看 到 JDK 











1.6 在 性 能 上 HJDK 1.5 略 有 优势 ， 说 明 至 少 在 Eclipse 启动 这 个 测试 用 例 上 ， 升 级 JDK 版 本 确实 能 带 来 一 些 “ 免 费 的 ”性 能 提升 。 














译 时 间 是 什么 ? 程序 在 运行 之 前 不 是 已 经 编译 了 吗 ? 虚拟 机 的 川 编译 与 垃圾 收集 一 样 





图 5-8 ”运行 在 JDK 1.6 下 取消 字 节 码 验 证 的 启动 时 间 








前 面 说 过 ， 除 了 类 加 载 时 间 以 外 ， 在 VisualGC 的 监视 曲线 中 显示 了 两 项 很 大 的 非 











户 程序 耗 时 : 编译 时 间 (Compile Time) 和 垃圾 收集 时 间 (GC Time) 。 垃 圾 收集 时 间 读 者 应 该 非常 清楚 了 ,而 编 
， 是 本 书 的 一 个 重要 部 分 ， 后 面 有 专门 章节 讲解 ， 这 里 先 简单 介绍 一 下 : 编译 时 间 是 指 虚拟 机 的 JIT 编 译 器 (Just In 


Time Compiler) 编译 热点 代码 (Hot Spot Code) 的 耗 时 。 我 们 知道 java 语言 为 了 实现 跨 平台 的 特性 ，Java 代 码 编译 出 来 后 形成 的 Class 文 件 中 储存 的 是 字 节 码 (ByteCode) ， 虚 拟 机 通过 解释 方式 执行 


字 节 码 命令 ， 比 起 C/C+ + 编译 成 本 地 二 进 制 代码 来 说， 速度 











慢 不 少 。 








为 了 解决 程序 解释 执行 的 速度 问题 ，JDK 1.2 以 后 ， 虚 拟 机 内 置 了 两 个 运行 时 编译 器 外 ， 如 果 一 段 Java 方 法 被 调用 的 次 数 到 达 一 定 程 


度 ， 就 会 被 判定 为 热 代码 ， 从 而 交 给 J 编译 器 即时 编译 为 本 地 代码 ， 以 提高 运行 速度 (这 就 是 HotSpot 虚 拟 机 名 字 的 由 来 ) 。 甚 至 有 可 能 在 运行 期 动态 编译 比 C/C+ + 的 编译 器 静态 编译 出 来 的 代码 更 优秀 ， 





更 多 的 优化 措施 。 如 果 使 
Eclipse 的 话 ，C2 编 译 器 所 消耗 的 额外 编译 时 间 最 终 还 是 会 在 运行 速度 的 提升 之 中 赚 回来 ， 这 样 使 用 -server 模 式 也 是 一 个 不 错 的 选择 。 不 过 至 少 在 本 次 实战 中 ， 我 们 还 是 继续 选 


因为 运行 期 可 以 收集 很 多 编译 器 无 法 知道 的 信息 ， 甚 至 可 以 采 
泄漏 ) ， 随 着 代码 被 编译 得 越 来 越 彻 底 ， 

















一 些 很 激进 的 优化 手段 ， 在 优化 条 件 不 成 立 的 时 候 再 逆 优 化 退回 来 。 所 以 Java 程 序 只 要 代码 没有 问题 (主要 是 泄漏 问题 ， 如 内 存 泄漏 、 连 接 
运行 速度 应 当 是 越 来 越 快 。Java 运 行 期 编译 最 大 的 缺点 就 是 编译 需要 消耗 程序 正常 的 运行 时 间 ， 也 就 是 上 面 所 说 的 “编译 时 间 ”。 


虚拟 机 提供 了 一 个 参数 -Xint 禁 止 编译 器 运作 ， 强 制 虚拟 机 对 字 节 码 采 用 纯 解释 方式 执行 。 如 果 读 者 想 使 用 这 个 参数 省 下 Eclipse 启动 中 那 2 秒 的 编译 时 间 获 得 一 个 “更 好 看 ”的 成 绩 的 话 ， 那 恐怕 要 失望 
加 上 这 个 参数 之 后 虽然 编译 时 间 确 实 下降 到 0， 但 Eclipse 启动 的 总 时 间 将 剧 增 到 27 秒 。 看 来 这 个 参数 现在 最 大 的 作用 就 是 让 用 户 缅怀 一 下 JDK 1.2 之 前 那 令 人 心酸 和 心 碎 的 运行 速度 。 











与 解释 执行 相对 应 的 另 一 方面 ， 虚 拟 机 还 有 力度 更 强 的 编译 器 : 当 虚 拟 机 运行 在 client 模式 的 时 候 ， 使 























的 是 一 个 代号 为 C1 的 轻 量 级 编译 器 ， 另 外 还 有 一 个 代号 为 C2 的 相对 重量 级 的 编译 器 ， 














-server 模 式 的 虚拟 机 启动 Eclipse 将 会 用 到 C2 编译 器 ， 这 时 从 VisualGC 可 以 看 到 启动 过 程 中 虚拟 机 使 








了 超过 15 秒 的 时 间 去 进行 代码 编译 。 丸 





它 能 提供 


果 读 者 的 工作 习惯 是 长 时 间 不 关闭 











Eclipse。 


5.34 ”调整 内 存 设置 控制 垃圾 收集 频率 


























三 大 块 非 





























会 下 降 ， 但 是 垃圾 收集 是 随 着 程序 的 运行 而 不 断 运作 的 ， 所 以 它 对 性 能 的 影响 才 尤 为 重要 。 


每 当 发 生 一 次 垃圾 收集 的 动作 ， 所 有 的 
作 。 





程序 时 间 中 ， 还 剩 下 GC 时 间 没 有 调整 ， 而 GC 时 间 却 是 其 中 最 重要 的 一 块 ， 并 不 只 是 因为 它 是 耗 时 最 长 的 一 块 ， 更 因 
动 时 间 ， 类 加 载 和 编译 时 间 在 这 项 测试 中 的 影响 力 被 大 幅度 放大 了 。 在 绝 大 多 数 的 应 














-Client 虚 拟 机 来 运行 








为 它 是 一 个 持续 稳定 的 过 程 。 由 于 我 们 所 做 的 测试 是 在 检测 程序 的 启 
中 ,不 可 能 出 现 持续 不 断 的 类 被 加 载 和 和 镍 载 。 在 程序 运行 一 段 时 间 后 ， 热 点 方法 不 断 被 编译 ， 新 的 热点 方法 数量 也 总 


在 Eclipse 启 动 的 原始 数据 样本 中 ， 短 短 15 秒 类 共 发 生 了 19 次 Full GC 和 378 次 Minor GC， 一 共 397 次 GC， 共 造成 了 超过 4 秒 的 停顿 ， 也 就 是 超过 1/4 的 时 间 都 是 在 进行 垃圾 收集 ， 这 个 运行 数据 看 起 来 实 
在 是 太 糟 糕 了 。 





首先 来 解决 新 生 代 中 的 Minor GC， 虽 然 GC 的 总 时 间 只 有 不 到 1 秒 ， 但 却 发 生 了 378 次 之 多 。 从 VisualGC 的 线程 监视 中 看 到 Eclipse 启动 期 间 一 共 发 起 了 超过 70 个 线程 ， 同 时 在 运行 的 线程 数 超过 25 个 ， 


























新 生 代 G(C 频 繁 发 生 ， 很 明显 是 由 于 虚拟 机 分 配给 新 生 代 的 空间 太 小 而 导致 的 ，Eden 区 加 上 一 个 Survivor 区 还 不 到 35MB， 


再 来 看 一 看 那 19 次 Full GC， 看 起 来 19 次 并 “不 多 ” 




















代码 清单 5-9 Full GC 记录 


户 线程 9 都 必须 跑 到 最 近 的 一 个 安全 点 (SafePoint) ， 然 后 挂 起 线程 等 待 垃 圾 回收 。 这 样 过 于 频繁 的 








GC 就 会 导致 很 多 没有 必要 的 安全 点 检测 、 线 程 挂 起 及 恢复 操 








此 很 有 必要 使 








(相对 于 378 次 Minor GC 来 说 ) ， 但 总 共 消耗 了 3.166 秒 ， 占 了 绝 大 部 分 的 GC 时 间 ， 降 低 GC 时 间 的 主要 
于 上 看 得 不 够 精确 ， 这 次 直接 从 GC 日 志 [10] 中 分 析 一 下 这 些 Full GC 是 如 何 产生 的 ， 代 码 清单 5-9 中 是 启动 最 开始 的 2.5 秒 内 发 生 的 10 次 Full GC 





-Xmn 参 数 调整 新 生 代 的 大 小 。 














标 就 是 降低 这 部 分 时 间 。 从 VisualGC 的 曲 

















的 记录 。 

















0.278: [GC 0.278: [DefNew: 574K->33K(576K), 0.0012562 secs]0.279: [Tenured: 1467K->997K(1536K), 0.0181775 secs] 1920K->997K(2112K), 0.0195257 secs] 

0.312: [GC 0.312: [DefNew: 575K->64K(576K), 0.0004974 secs]0.312: [Tenured: 1544K->1608K(1664K), 0.0191592 secs] 1980K->1608K(2240K), 0.0197396 secs] 

0.590: [GC 0.590: [DefNew: 576K->64K(576K), 0.0006360 secs]0.590: [Tenured: 2675K->2219K(2684K), 0.0256020 secs] 3090K->2219K(3260K) ，0.0263501 secs] 

0.958: [GC 0.958: [DefNew: 551K->64K(576K), 0.0011433 secs]0.959: [Tenured: 3979K->3470K(4084K), 0.0419335 secs] 4222K->3470K(4660K) ，0.0431992 secs] 

1.575: [Full GC 1.575: [Tenured: 4800K->5046K(5784K), 0.0543136 secs] 5189K->5046K(6360K), [Perm : 12287K->12287K(12288K)], 0.0544163 secs] 

1.703: [GC 1.703: [DefNew: 703K->63K(704K), 0.0012609 secs]1.705: [Tenured: 8441K->8505K(8540K), 0.0607638 secs] 8691K->8505K(9244K), 0.0621470 secs] 

1.837: [GC 1.837: [DefNew: 1151K->64K(1152K), 0.0020698 secs]1.839: [Tenured: 14616K->14680K(14688K), 0.0708748 secs] 15035K->14680K(15840K), 0.0730947 secs] 
2.144: [GC 2.144: [DefNew: 1856K->191K(1856K), 0.0026810 secs]2.147: [Tenured: 25092K->24656K(25108K), 0.1112429 secs] 26172K->24656K(26964K) ，0.1141099 secs] 
2.337: [GC 2.337: [DefNew: 1914K->0K(3136K), 0.0009697 secs]2.338: [Tenured: 41779K->27347K(42056K), 0.0954341 secs] 42733K->27347K(45192K) ，0.0965513 secs] 
2.465: [GC 2.465: [DefNew: 2490K->0K(3456K), 0.0011044 secs]2.466: [Tenured: 46379K->27635K(46828K), 0.0956937 secs] 47621K->27635K(50284K) ，0.0969918 secs] 
括号 中 加 粗 的 数字 代表 着 老年 代 的 容量 ， 这 组 GC 日 志 显示 了 10 次 Full GC 发 生 的 原因 全 部 都 是 老年 代 空间 耗 尽 ， 每 发 生 一 次 Full GC 都 伴随 着 一 次 老年 代 空间 扩容 : 1536KB 一 1664KB 一 2684KB 一 …… 


一 42056KB 一 46828KB，10 次 GC 以 后 老年 代 容量 从 起 始 的 1536KB 扩 大 到 46828KB， 当 15 秒 后 Eclipse 启 动 完 成 时 ， 老 年 代 容量 扩大 到 了 103428KB， 代 码 编译 开始 后 ， 老 年 代 容量 达到 顶峰 473MB， 整 个 














ava 堆 达到 最 大 容量 512MB。 


到 25092KB 的 时 候 发 生 Full GC， 花 费 0.11 秒 把 内 存 使 用 降低 到 24656KB， 只 回 
费时 间 的 ， 所 以 说 这 0.11 秒 几乎 是 白 























日 志 还 显示 有 些 时 候 内 存 回收 状况 很 不 理想 ， 空 间 扩容 成 为 获取 可 用 内 存 的 最 主要 手段 ， 璧 如 ， 

















浪费 了 。 


























“Tenured: 25092K 一 24656K(25108K)，0.1112429secs” 代 表 老 年 代 的 当前 容量 为 25108KB， 内 存 使 
疏 了 不 到 500KB 的 内 存 ， 这 次 GC 基 本 没有 什么 回收 效果 ， 仅 仅 做 了 扩容 ， 扩 容 过 程 比 起 回收 过 程 可 以 看 做 是 基本 不 需要 花 








由 上 述 分 析 可 以 得 出 结论 : Eclipse 启动 时 Full GC 大 多 数 是 由 于 老年 代 容量 扩展 而 导致 的 ， 由 永久 代 空 间 扩展 而 导致 的 也 有 一 部 分 。 为 了 避免 这 些 扩展 所 带 来 的 性 能 浪费 ， 我 们 可 以 把 -Xms 和 -XX: 
PermSize 参 数值 分 别 设置 为 -Xmx 和 -XX: PermSizeMax 参 数值 ， 强 制 虚拟 机 在 启动 的 时 候 就 把 老年 代 和 永久 代 的 容量 固定 下 来 ， 避 免 运 行 时 自动 扩展 [11]。 

















根据 分 析 ， 优 化 计划 确定 为 : 把 新 生 代 容 量 提升 到 128MB， 避 免 新 生 代 频繁 G6C; 把 Java 堆 、 永 久 代 的 容量 分 别 固定 为 512MB 和 96MBI15， 避 免 内 存 扩展 。 这 几 个 数值 都 是 根据 机 器 硬件 、Eclipse 插 件 
和 工程 数量 来 决定 的 ， 读 者 实战 的 时 候 应 根据 VisualGC 中 收集 到 的 实际 数据 进行 设置 。 改 动 后 的 eclipse.in 瑟 置 如 代码 清单 5-10 所 示 。 








代码 清单 5-10 ”内 存 调 整 后 的 Eclipse 配置 文件 





一 vm 
D:/_DevSpace/jdk1.6.0 21/bin/javaw.exe 
-startup 


plugins/org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 


-launcher.library 
plugins/org.eclipse.equinox.launcher .win32 
-product 
org.eclipse.epp.package.jee.product 
-showsplash 

org.eclipse.platform 

-vmargs 
-Dosgi.requiredJavaVersion=1.5 
-Xverify:none 

—Xmx512m 

-Xms512m 

—Xm128m 

—XX:PermSize=96m 
—XX:MaxPermSize=96m 


.win32.x86 1.0.200.v20090519 





现在 的 这 个 配置 之 下 ，GC 次 数 已 经 大 幅度 降低 ， 


这 个 结果 已 经 算是 基本 正常 ， 但 是 还 存在 一 点 瑕 症 : 从 Old Gen 曲 线 上 看 ， 永 久 代 直 接 固 定 在 384MB， 而 内 存 使 有 
因 ， 见 代码 清单 5-11。 


来 的 ? 使 用 jstat-gccause 查 询 一 下 最 近 一 次 GC 的 原 
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代码 清单 5-11 ”查询 GC 原因 





图 5-9 是 Eclipse 启动 后 1 分 钟 的 监视 曲线 ， 只 发 生 了 8 次 Minor GC 和 4 次 Full GC， 总 耗 时 为 1.928 秒 。 
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图 5-9 GC 调整 后 的 运行 数据 





C:\Users\IcyFenix>jps 
9772 Jps 


4068 org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 


C:\Users\IcyFenix>jstat -gccause 4068 
S0 S1 E 0 要 YGC 
0.00 O00 1.00 14.81 39.29 6 

System.gc () No GC 


YGCT 


FEGC 
0.422 


FGCT GCT 
20 S992 


LGCC 
6.414 


GCC 





从 LGCC (Last GC Cause) 中 看 到 原来 是 代码 调用 System.gc() 显 式 触发 的 GC， 在 内 存 设置 调整 后 ， 这 种 显 式 GC 不 符合 我 们 的 期 望 ， 





因此 在 eclipse.ini 中 加 入 参数 -XX: +DisableExplicitGC 屏 蔽 掉 


System.gc()。 再 次 测试 发 现 启动 期 间 的 Full GC 已 经 完全 没有 了 ， 只 有 6 次 Minor GC， 耗 时 417 毫 秒 ， 与 调 优 前 4.149 秒 的 测试 样本 相 比 ， 正 好 是 十 分 之 一 。 进 行 GC 调 优 后 Eclipse 的 启动 时 间 下 降 非常 明 





显 ， 比 整个 GC 时 间 降 低 的 绝对 值 还 大 ， 现 在 启动 只 需要 7 秒 多 ， 如 图 5-10 所 示 。 





明 量 只 有 66MB， 并 且 一 直 很 平滑 ， 完 全 不 应 该 发 生 Full GC 才 对 ， 那 4 次 Full GC 是 怎么 





图 5-10 Eclipse 启动 时 间 


5.3.5 ”选择 收集 器 降低 延迟 


现在 Eclipse 启动 已 经 比较 迅速 了 ， 但 我 们 的 调 优 实战 还 没有 结束 ， 毕 竟 Eclipse 是 拿 来 写 程序 的 ， 不 是 拿 来 测试 启动 速度 的 。 我 们 不 妨 再 在 Eclipse 中 测试 一 个 非常 常用 但 又 比较 耗 时 的 操作 : 代码 编译 。 
图 5-11 是 当前 配置 下 Eclipse 进行 代码 编译 时 的 运行 数据 ， 从 图 中 可 以 看 出 ， 新 生 代 每 次 回收 耗 时 约 65 毫 秒 ， 老 年 代 每 次 回收 耗 时 约 725 毫 秒 。 对 于 用 户 来 疝 ， 新 生 代 GC 的 耗 时 还 好 ，65 毫 秒 在 使 用 中 无 法 
察觉 到 ， 而 老年 代 每 次 GC 停 顿 的 时 间接 近 1 秒 钟 ， 虽 然 比较 长 时 间 才 会 出 现 一 次 ， 但 停顿 还 是 太 长 了 一 些 。 
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图 5-11 编译 期 间 运 行 数据 





再 注意 看 一 下 编译 期 间 的 CPU 资源 使 用 状况 ， 图 5-12 是 Eclipse 在 编译 期 间 的 CPU 使 用 率 曲线 图 ， 整 个 编译 过 程 中 平均 只 使 用 了 不 到 30% 的 CPU 资源 ， 垃 圾 收集 的 CPU 使 用 率 曲线 更 是 几乎 与 坐标 横 轴 紧 
贴 在 一 起 ， 这 说 明 CPU 资 源 还 有 很 多 可 利用 的 余地 。 
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图 5-12 ”编译 期 间 CPU 的 曲线 


列举 GC 停 顿时 间 、CPU 资 源 富 余 的 目的 ， 都 是 为 接 下 来 蔡 换 掉 Client 模 式 的 虚拟 机 中 默认 的 新 生 代 及 老年 代 串 行 收集 器 做 铺垫 。 














Eclipse 应 当 算 是 与 使 用 者 交互 非常 频繁 的 应 用 程序 ， 由 于 代码 太 多 ， 笔 者 习惯 在 做 全 量 编译 或 清理 动作 的 时 候 ， 使 用 “Run in Backgroup” 功 能 一 边 编译 一 边 继续 工作 。 回 顾 一 下 在 第 3 章 提 到 的 几 种 
收集 器 ， 很 容易 想到 CMS 是 最 符合 这 类 场景 的 收集 器 。 因 此 尝试 在 eclipse.ini 中 再 加 入 两 个 参数 -XX: +UseConcMarkSweepGC 和 -XX: +UseParNewGC (ParNew 收 集 器 是 使 用 CMS 收集 器 后 的 默认 新 
生 代 收集 器 ， 写 上 仅 是 为 了 使 得 配置 更 加 清晰 ) ， 要 求 虚拟 机 在 新 生 代 和 老年 代 分 别 使 用 ParNew 和 CMS 收集 器 进行 垃圾 回收 。 指 定 收集 器 之 后 ， 再 次 测试 的 结果 如 图 5-13 所 示 ， 与 原来 使 用 的 串 行 收集 器 
对 比 ， 新 生 代 停顿 从 每 次 65 毫 秒 下 降 到 了 每 次 53 毫 秒 ， 而 老年 代 的 停顿 时 间 更 是 从 725 毫 秒 大 幅 下 降 到 了 36 毫 秒 。 


































































































当然 ，CMS 的 停顿 阶段 只 是 收集 过 程 中 的 一 小 部 分 ， 并 不 是 真 的 把 垃圾 收集 时 间 从 725 毫 秒 变 成 36 毫 秒 了 。 在 GC 日 志 中 可 以 看 到 CM 与 程序 并 发 的 时 间 约 为 400 毫 秒 。 不 过 由 于 CMS 默认 老年 代 使 
了 68% 就 进行 收集 ， 所 以 Full GC 次 数 上 升 到 了 6 次 ， 为 了 避免 总 体 吞 吐 量 下 降 得 太 厉 害 ， 使 用 -XX: CMSslnitiatingOccupancyFraction=85 将 GC 临 界 值 提升 到 859%， 修 改 -XX: 
CMSInitiatingOccupancyFraction 参 数 后 ，Full GC 次 数 下 降 至 3 次 ， 这 样 收集 器 的 运作 结果 就 比较 令 人 满意 了 。 


















































Graphs 4 


Compile Time: 6118 compiles — 4.074s 


“TT 
ES 





FClass Loader Time: 9227 loaded，0 unloaded - 5.640s 











FrCC Time: 58 collections，3.010s Last Cause: unknown GCCause 
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rEden Space (102.500NM, 102. 500) : 23.200N, 52 collections, 2.789s 








Survivor 0 (12.750M, 12.750M): 6.390M 
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-Survivor 1 (12.750N, 12.750M): 0- 一 








roOld Gen (384.000NM, 384.000NM): 224.520N, 6 collections，221. 337ms 


FrPerm Gen (96.000M, 96.000M): 50.763m 

















图 5-13 ”指定 ParNew 和 CMS 收 集 器 后 的 GC 数据 


到 这 里 为 止 ， 对 于 虚拟 机 内 存 的 调 优 就 基本 结束 了 ， 这 次 实战 可 以 看 做 是 一 次 简化 的 服务 端 调 优 过 程 ， 服 务 端 调 优 有 可 能 还 会 出 现在 更 多 方面 ， 如 数据 库 、 资 源 池 、 磁 盘 |/O 等 ， 对 于 虚拟 机 内 存 部 分 的 
优化 ， 与 这 次 实战 中 的 思路 没有 太 大 差别 。 即 使 读者 实际 工作 中 接触 不 到 服务 器 ， 根 据 自 己 的 工作 环境 做 一 些 试验 ， 总 结 几 个 参数 让 自己 日 常 工作 环境 的 速度 有 较 大 幅度 的 提升 也 是 很 划算 的 。 最 终 
eclipse.ini 的 配置 如 代码 清单 5-12 所 示 。 


代码 清单 5-12 ”修改 收集 器 配置 后 的 Eclipse 配置 





D:/_DevSpace/jdk1.6.0 21/bin/javaw.exe 
-startup 
plugins/org.eclipse.equinox.launcher 1.0.201.R35x v20090715.jar 
-launcher.library 
plugins/org.eclipse.equinox.launcher .win32.win32.x86 1.0.200.v20090519 
-product 
org.eclipse.epp.package.jee.product 
-showsplash 

org.eclipse.platform 

—vmargs 

-Dcom. sun.management . jmxremote 

-Dosgi .requiredJavaVersion=1.5 
-Xverify:none 

—Xmx512m 

-Xms512m 

—Xnmm128m 

—XX:PermSize=96m 

—XX:MaxPermSize=96m 
—XX:+DisableExplicitGC 

-Xnoclassgc 

—XX:+UseParNewGC 
-XX:+UseConcMarkSweepGC 
-XX:CMSInitiatingOccupancyFraction=85 





版 本 升级 也 有 不 少 性 能 倒退 的 案例 ， 受 程序 、 第 三 方 包 兼 容 性 及 中 间 件 限制 ， 在 企业 应 用 中 升级 JDK 版 本 是 一 件 需要 慎重 考虑 的 事情 。 
2] 测试 用 例 、 数 据 及 图 片 来 源 于 http://www.taranfx.com/java-7-whats-new-performance-benchmatk-1-5-1-6-1-7。 


四 


官方 网 站 : http://www.spec.org/jvm2008/docs/UserGuide.html。 
TCK (Technology Compatibility Kit) 是 一 套 由 一 组 测试 用 例 和 相应 的 测试 工具 组 成 的 工具 包 ， 用 于 保证 一 个 使 用 Java 技 术 的 实现 能 够 完全 遵守 其 适用 的 Java 平 台 规范 ， 并 且 符 合 相应 的 参考 实现 。 
5] https://bugs.eclipse.org/bugs/show_bug.cgi?id=319514 


EN 


6] http:/ /java.sun.com/ performance/reference/whitepapers/6_performance.html 

[7] 关于 JDK 1.6 与 JDK 1.5 在 Eclipse 启 动 时 类 加 载 速 度 差异 的 讨论 ， 参 见 : http://www.javaeye.com/topic/826542。 

8] JDK 1.2 之 前 也 可 以 使 用 外 挂 JIT 编译 器 进行 本 地 编译 ， 但 只 能 与 解释 器 二 选 其 一 ， 不 能 同时 工作 。 

9] 严格 来 说 ， 不 包括 正在 执行 native 代 码 的 用 户 线程 ， 因 为 native 代 码 一 般 不 会 改变 Java 对 象 的 引用 关系 ， 所 以 没有 必要 挂 起 它们 来 等 待 垃圾 回收 。 

10] 可 以 通过 以 下 几 个 参数 要 求 虚 拟 机 生成 GC 上 日志: -XX:+PrintGCTimeStamps ( 打印 GC 停顿 时 间 ) 、-XX:+PrintGCDetails (打印 GC 详细 信息 ) 、-verbose:gc (打印 GC 信息 ， 输 出 内 容 已 被 前 一 个 参数 包 
括 ， 可 以 不 写 ) 、-Xloggc:gc.log。 

11 需要 说 明 一 点 ， 庶 拟 机 启动 的 时 候 就 会 把 参数 中 所 设 定 的 内 存 全 部 划 为 私有 ， 即 使 扩容 前 有 一 部 分 内 存 不 会 被 用 户 代码 用 到 ， 这 部 分 内 存 也 不 会 交 给 其 他 进程 使 用 。 这 部 分 内 存在 虚拟 机 中 被 标识 
为 “Virtual” 内 存 。 

12] 512MB 和 96MB 两 个 数值 对 于 笔者 的 应 用 情况 来 说 依然 偏 少 ,但 由 于 笔者 需要 同时 开 VMWare 工 作 ， 所 以 要 预 留 较 多 内 存 空间 ， 读 者 在 实际 调 优 时 不 妨 再 设置 大 一 些 。 











5.4 ”本 章 小 结 





Java 庶 拟 机 的 内 存 管理 与 垃圾 收集 是 虚拟 机 结构 体系 中 最 重要 的 组 成 部 分 ， 对 我 们 程序 的 性 能 和 稳定 性 有 着 非常 大 的 影响 ， 在 本 书 的 第 2~5 章 中 ， 笔 者 从 理论 知识 、 异 常 现象 、 代 码 、 工 具 、 案 例 和 实 


战 等 几 个 方面 对 其 进行 讲解 ， 希 望 读 者 能 有 所 收获 。 




















本 书 关 于 虚拟 机 内 存 管理 的 部 分 到 此 为 止 就 结束 了 ， 下 一 章 我 们 将 开始 学 习 Class 文 件 与 虚拟 机 执行 子 系统 方面 的 知识 。 














三 部 分 “虚拟 机 执行 子 系统 


第 6 章 ”类 文件 结构 
第 7 章 ”虚拟 机 类 加 载 机 制 
第 8 章 ”虚拟 机 字 节 码 执行 引擎 


第 9 章 ”类 加 载 及 执行 子 系统 的 案例 与 实战 


第 6 章 ”类 文件 结构 


本 章 主要 内 容 





:无关 性 的 基石 


' Class 类 文件 的 结构 


"Class 文件 结构 的 发 展 








代码 编译 的 结果 从 本 地 机 器 码 转 变 为 字 节 码 ， 是 存储 格式 发 展 的 一 小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


6.1 概述 





记得 在 第 一 节 计 算 机 程序 课 上 老师 就 讲 过 : “计算 机 只 认识 0 和 1， 所 以 我 们 写 的 程序 需要 被 编译 器 翻译 成 由 0 和 1 构成 的 二 进 制 格式 才能 被 计算 机 执行 ”。10 多 年 的 时 间 过 去 了 ， 今 天 的 计算 机 仍然 只 能 





识别 0 和 1， 但 由 于 最 近 10 年 内 虚拟 机 及 建立 在 虚拟 机 之 上 的 大 量程 序 语言 如 雨后春笋 般 出 现 并 莲 勃 发 展 ， 将 我 们 编写 的 程序 编译 成 二 进 制 本 地 机 器 码 (Native Code) 已 
序 语言 选择 了 与 操作 系统 和 机 器 指令 集 无 关 的 、 平 台中 立 的 格式 作为 程序 编译 后 的 存储 格式 。 








6.2 无 关 性 的 基石 














如 果 计 算 机 的 CPU 指令 集 就 只 有 x86 一 种 ， 操 作 系统 就 只 有 Windows 一 种 ， 那 也 许 就 不 会 有 Java 语 言 的 出 现 。Java 在 刚刚 诞生 之 时 曾经 提出 过 一 个 非常 著名 的 宣传 














不 再 是 唯一 的 选择 ， 越 来 越 多 的 程 


号 : “一 次 编写 ， 到 处 运行 (Write 


Once，Run Anywhere) ”， 这 句 话 充分 表达 了 软件 开发 人 员 对 冲破 平台 界限 的 渴求 。 在 无 时 无 刻 不 充满 竞争 的 IT 领域 ， 不 可 能 只 有 WintelIT] 存 在 ， 我 们 也 不 希望 只 有 Wintel 存 在 ， 各 种 不 同 的 硬件 体系 结 
构 和 不 同 的 操作 系统 定 将 会 长 期 并 存 发 展 。“ 与 平台 无 关 ” 的 理想 最 终 实现 在 操作 系统 的 应 用 层 上 : Sun 公 司 及 其 他 虚拟 机 提供 商 发 布 了 许多 可 以 运行 在 各 种 不 同 平台 上 的 虚拟 机 ， 这 些 虚 拟 机 都 可 以 载 入 












































和 执行 同一 种 平台 无 关 的 字 节 码 ， 从 而 实现 程序 的 “一 次 编写 ， 到 处 运行 ”。 











各 种 不 同 平台 的 虚拟 机 与 所 有 平台 都 统一 使 用 的 程序 存储 格式 一 一 字 节 码 (ByteCode) 是 构成 平台 无 关 性 的 基石 ， 但 本 节 标题 中 刻意 省 略 了 “平台 ”二 字 ， 那 是 因为 笔者 注意 到 虚拟 机 的 另外 一 种 中 





























立 的 特性 一 一 如 今 语言 无 关 性 越 来 越 被 开发 者 所 重视 。 到 今天 为 止 ， 或 许 大 部 分 程序 员 都 还 认为 Java 虚 拟 机 执行 Java 程 序 是 一 件 理所当然 和 天 经 地 义 的 事情 。 但 在 Java 发 展 之 初 ， 设 计 者 们 就 曾经 考虑 过 并 
实现 了 让 其 他 语言 运行 在 Java 虚 拟 机 之 上 的 可 能 性 ， 他 们 在 发 布 规范 文档 的 时 候 ， 也 刻意 把 Java 的 规范 拆 分 成 了 Java 语 言 规 范 《The Java Language Specification》 及 Java 虚 拟 机 规范 《The Java Virtual 
Machine Specification》。 时 至 今日 ， 商 业 机 构 和 开源 机 构 已 经 在 Java 语 言 之 外 发 展 出 一 大 批 在 Java 虚拟 机 之 上 运行 的 语言 ， 如 Clojure、Groovy、 欠 uby、Jython、Scala， 等 等 。 使 用 过 这 些 语言 的 开发 





























者 可 能 还 不 是 非常 多 ， 但 是 听 说 过 的 人 肯定 已 经 不 少 ， 随 着 时 间 的 推移 ， 谁 能 保证 日 后 Java 虚 拟 机 在 语言 无 关 性 上 的 优势 不 会 赶 上 甚至 超越 它 在 平台 无 关 性 上 的 优势 呢 ? 






























































实现 语言 无 关 性 的 基础 仍然 是 虚拟 机 和 字 节 码 存 储 格式 ， 使 用 java 编译 器 可 以 把 Java 代 码 编译 为 存储 字 节 码 的 Class 文 件 ， 使 用 JRuby 等 其 他 语言 的 编译 器 一 样 可 以 把 程序 代码 编译 成 Class 文 件 ， 虚 拟 机 























并 不 关心 Class 的 来 源 是 什么 语言 ， 只 要 它 符合 Class 文 件 应 有 的 结构 就 可 以 在 Java 虚 拟 机 中 运行 ， 如 图 6-1 所 示 。 























Java 语 言 中 的 各 种 变量 、 关 键 字 和 运算 符号 的 语义 最 终 都 是 由 多 条 字 节 码 命令 组 合 而 成 的 ， 因 此 字 节 码 命令 所 能 提供 的 语义 描述 能 力 上 表 定 会 比 Java 语 言 本 身 更 强大 。 
效 支持 的 语言 特性 并 不 代表 字 节 码 本 身 无 法 有 效 支持 ， 这 也 为 其 他 语言 实现 一 些 有 别 于 Java 的 语言 特性 提供 了 基础 。 








因此 ， 有 一 些 Java 语 言 本 身 无 法 有 





Javac 编译 器 ~ 


JRuby 程 序 
(*.rb) 


jrubye 编译 器 





Ey Java 虚拟 机 


Groov y 程 序 


(*. groovy ) groovyc 编译 器 





对 应 的 编译 器 | 号 





图 6-1 Java 虚 拟 机 提供 的 语言 无 关 性 


[1] Wintel: 微软 的 Windows 与 Intel 的 芯片 相 结 合 ， 曾 经 是 业界 最 强大 的 联盟 。 


6.3 “Class 类 文件 的 结构 























解析 Class 文 件 的 数据 结构 是 本 章 的 最 主要 内 容 。 笔 者 曾经 在 前 言 中 阐述 过 本 书 的 写作 风格 : 力求 在 保证 逻辑 准确 的 前 提 下 ， 用 尽量 通俗 的 语言 和 案例 去 讲述 虚拟 机 中 与 开发 关系 最 为 密切 的 内 容 。 但 
是 ， 对 数据 结构 方面 的 讲解 不 可 避免 地 会 比较 枯燥 ， 而 这 部 分 内 容 又 是 了 解 虚 拟 机 的 重要 基础 之 一 。 如 果 想 比较 深入 地 了 解 虚拟 机 ， 这 部 分 是 不 能 不 接触 的 。 












































Class 文 件 是 一 组 以 8 位 字 节 为 基础 单位 的 二 进 制 流 ， 各 个 数据 项 目 严格 按照 顺序 紧凑 地 排列 在 Class 文 件 之 中 ， 中 间 没 有 添加 任何 分 隔 符 ， 这 使 得 整个 Class 文 件 中 存储 的 内 容 几乎 全 部 都 是 程序 运行 的 
必要 数据 ， 没 有 空隙 存在 。 当 遇 到 需要 占用 8 位 字 节 以 上 空间 的 数据 项 时 ， 则 会 按照 高 位 在 前 的 方式 分 割 成 若干 个 8 位 字 节 进行 存储 。 









































根据 Java 虚 拟 机 规范 的 规定 ，Class 文 件 格式 采用 一 种 类 似 于 C 语 言 结构 体 的 伪 结 构 来 存储 ， 这 种 伪 结 构 中 只 有 两 种 数据 类 型 : 无 符号 数 和 表 ， 后 面 的 解析 都 要 以 这 两 种 数据 类 型 为 基础 ， 所 以 这 里 要 先 








讲 明白 这 两 个 概念 。 



































无 符号 数 属于 基本 的 数据 类 型 ， 以 u1、u2、u4、u8 来 分 别 代表 1 个 字 节 、2 个 字 节 、4 个 字 节 和 8 个 字 节 的 无 符号 数 ， 无 符号 数 可 以 用 来 描述 数字 、 索 引 引 用 、 数 量 值 ， 或 者 按照 UTF-8 编 码 构成 字符 串 


值 。 
表 是 由 多 个 无 符号 数 或 其 他 表 作 为 数据 项 构成 的 复合 数据 类 型 ， 所 有 表 都 习惯 性 地 以 “_info” 结 尾 。 表 用 于 描述 有 层次 关系 的 复合 结构 的 数据 ， 整 个 Class 文 件 本 质 上 就 是 一 张 表 ， 它 由 表 6-1 所 示 的 数 
据 项 构成 。 























表 6-1 Class 文件 格式 





类 型 名 称 数 量 
u4 magic 1 
u2 minor_version 1 
u2 major_version 1 
u2 constant pool count 1 
cp_info constant_pool constant_pool count—1 
u2 access flags 1 
u2 this_class 1 
u2 super_class 1 
u2 interfaces_count 1 
u2 interfaces interfaces_count 
u2 fields_count 1 
field_info fields fields_count 
u2 methods_count 1 
method_info methods methods_count 
U2 attributes_count 1 
attribute_info attributes attributes_count 






































无 论 是 无 符号 数 还 是 表 ， 当 需要 描述 同一 类 型 但 数量 不 定 的 多 个 数据 时 ， 经 常会 使 用 一 个 前 置 的 容量 计数 器 加 若干 个 连续 的 数据 项 的 形式 ， 这 时 候 称 这 一 系列 连续 的 某 一 类 型 的 数据 为 某 一 类 型 的 集 


和 全 
口 。 

















本 节 结 束 之 前 ， 笔 者 需要 再 重复 一 下 ，Class 的 结构 不 像 XML 等 描述 语言 ， 由 于 它 没有 任何 分 隔 符号 ， 所 以 在 表 6-1 中 的 数据 项 ， 无 论 是 顺序 还 是 数量 ， 都 是 被 严格 限定 的 ， 哪 个 字 节 代表 什么 含义 ,长 
度 是 多 少 ， 先 后 顺序 如 何 ， 都 不 允许 改变 。 接 下 来 我 们 将 一 起 看 看 这 个 表 中 各 个 数据 项 的 具体 含义 。 











6.3.1 ” 魔 数 与 Class 文 件 的 版 本 


























每 个 Class 文 件 的 头 4 个 字 节 称 为 魔 数 (Magic Number) ， 它 的 唯一 作用 是 用 于 确定 这 个 文件 是 否 为 一 个 能 被 虚拟 机 接受 的 Class 文 件 。 很 多 文件 存储 标准 中 都 使 用 魔 数 来 进行 身份 识别 ， 辟 如 图 片 格 
式 ， 如 gif 或 jpeg 等 在 文件 头 中 都 存 有 魔 数 。 使 用 魔 数 而 不 是 扩展 名 来 进行 识别 主要 是 基于 安全 考虑 ， 因 为 文件 扩展 名 可 以 很 随意 地 被 改动 。 文 件 格式 的 制定 者 可 以 自由 地 选择 魔 数值 ， 只 要 这 个 魔 数值 还 没 
有 被 广泛 采用 过 而 且 不 会 引起 混淆 即 可 。Class 文 件 的 魔 数 的 获得 很 有 “浪漫 气息 ”， 值 为 : 0xCAFEBABE (咖啡 宝贝 ?) ， 这 个 魔 数值 在 Java 还 被 称 做 “Oak” 语言 的 时 候 (大 约 是 1991 年 前 后 ) 就 已 经 确 
定 下 来 了 。 它 还 有 一 段 很 有 趣 的 历史 ， 据 Java 开 发 小 组 最 初 的 关键 成 员 Patrick Naughton 所 说 : “我 们 一 直 在 寻找 一 些 好 玩 的 、 容 易 记忆 的 东西 ， 选 择 0xCAFEBABE 是 因为 它 象征 着 著名 咖啡 品牌 Peet 担 
Coffee 中 深 受 欢迎 的 Baristas 咖 啡 ”， 这 个 魔 数 似乎 也 预示 着 日 后 “Java” 这 个 名 称 的 出 现 。 

























































































紧 接着 魔 数 的 4 个 字 节 存储 的 是 Class 文 件 的 版 本 号 : 第 5 和 第 6 个 字 节 是 次 版 本 号 (Minor Version) ， 第 7 个 和 第 8 个 字 节 是 主 版 本 号 (Major Version) 。Java 的 版 本 号 是 从 45 开 始 的 ，JDK 1.1 之 后 的 
每 个 JDK 大 版 本 发 布 主 版 本 号 向 上 加 1 (JDK 1.0~1.1 使 用 了 45.0~45.3 的 版 本 号 ) ， 高 版 本 的 JDK 能 向 下 兼容 以 前 版 本 的 Class 文 件 ， 但 不 能 运行 以 后 版 本 的 Class 文 件 ， 即 使 文件 格式 并 未 发 生变 化 。JDK 1.1 
能 支持 版 本 号 为 45.0~45.65535 的 Class， 无 法 执行 版 本 号 为 46.0 以 上 的 Class， 而 JDK 1.2 则 能 支持 45.0~46.65535 的 Class 文 件 。 现 在 ， 最 新 的 JDK 版 本 为 1.7， 可 生成 的 Class 文 件 主 版 本 号 的 最 大 值 为 
51.0。 为 了 讲解 方便 ， 笔 者 准备 了 一 段 最 简单 的 Java 代 码 (如 代码 清单 6-1 所 示 ) 本 章 后 面 的 讲解 都 将 以 这 段 小 程序 使 用 JDK 1.6 编 译 输出 的 Class 文 件 为 基础 来 讲解 。 




















代码 清单 6-1 简单 的 java 代码 





Package org.fenixsoft.clazz; 
public class TestClass { 
Private :int my 
public int inc() { 
returnm+1; 
: 
} 

















司 6-2 显 示 的 是 使 用 十 六 进 制 编辑 器 WinHex 打 开 这 个 Class 文 件 的 结果 ， 可 以 清楚 地 看 见 开头 4 个 字 节 的 十 六 进 制 表示 的 是 0xCAFEBABE， 代 表 次 版 本 号 的 第 5 个 和 第 6 个 字 节 值 为 0x0000， 而 主 版 本 号 
的 值 为 0x0032， 即 十 进 制 的 50， 该 版 本 号 说 明 这 个 是 可 以 被 JDK 1.6 或 以 上 版 本 的 虚拟 机 执行 的 Class 文 件 。 














Offset 0 1 3 3 6 7 .8 3 BC DE FE 





00000000 /CA FE BA BE 00 00 00 幼 00 16 07 00 02 01 00 1D 濑 壕 ...E........ 
00000010 6F 72 67 2F 66 65 6E 69| 必 庆 如 各 如 局 |2F 63 6C org/fenixsoft/cl 


00000020 61 7a 7A 2F 54 65 73 "A eencyso | 07 00 04 azz/TestClass... 
00000030 |01 00 10 6A 61 76 61 2FllL BIC) 5 . .java/lang/0bj 


图 6-2 Java Class 文 件 的 结构 





表 6-2 列 举 了 从 JDK 1.1 到 1.7 之 间 ， 主 流 JDK 版 本 编译 器 输出 的 默认 和 可 支持 的 Class 文 件 版 本 号 。 


表 6-2 Class 文件 版 本 号 


编译 器 版 本 
JDK 1.1.8 
JDK 1.2.2 
JDK 1.2.2 
JDK 1.3.1 19 
JDK 1.3.1 19 
JDK 1.4.2_10 
JDK 1.4.2_10 
JDK 1.5.0 11 
JDK 1.5.0 11 
JDK 1.6.0 01 
JDK 1.6.0 01 
JDK 1.6.0 01 
JDK 1.7.0 
JDK 1.7.0 
JDK 1.7.0 


6.3.2 ”常量 池 


-target 参数 
不 能 带 target 参数 
不 带 (默认 为 -target 1.1) 
-target 1.2 
不 带 (默认 为 -target 1.1) 
-target 1.3 
不 带 (默认 为 -target 1.2) 
-target 1.4 
不 带 (默认 为 -target 1.5) 
-target 1.4 -source 1.4 
不 带 (默认 为 -target 1.6) 
-target 1.5 
-target 1.4 -source 1.4 
不 带 (默认 为 -target 1.6) 
-target 1.7 


-target 1.4 -source 1.4 


十 六 进 制 版 本 号 
00 03 00 2D 
00 03 00 2D 
00 00 00 2E 
00 03 00 2D 
00 00 00 2F 
00 00 00 2E 
00 00 00 30 
00 00 00 31 
00 00 00 30 
00 00 00 32 
00 00 00 31 
00 00 00 30 
00 00 00 32 
00 00 00 33 
00 00 00 30 


十 进 制 版 本 号 
45.3 








紧 接 着 主 次 版 本 号 之 后 的 是 常量 池 人 入口， 
项 目 。 

















常量 池 是 Class 文 件 结构 中 与 其 他 项 目 关联 最 多 的 数据 类 型 ， 也 是 占 








Class 文 件 空间 最 大 的 数据 项 目 之 一 ， 同 时 它 还 是 在 Class 文 件 中 第 一 个 出 现 的 表 类 型 数据 




















由 于 常量 池 中 常量 的 数量 是 不 固定 的 ， 所 以 在 常量 池 的 入 口 需要 放置 一 项 U2 类 型 的 数据 ， 代 表 常 量 池 容 量 计 数值 (constant_pool_count) 。 与 Java 中 的 语言 习惯 不 一 样 的 是 ， 这 个 容量 计数 是 从 1 而 不 
是 0 开始 的 ， 如 图 6-3 所 示 ， 常 量 池 容量 ( 偏 移 地 址 : 0x00000008) 为 十 六 进 制 数 0x0016， 即 十 进 制 的 22， 这 就 代表 常量 池 中 有 21 项 常量 ， 索 引 值 为 1~21。 制 定 Class 文 件 格式 规范 时 ， 将 第 0 项 常量 空 出 来 
是 有 特殊 考虑 的 ， 这 样 做 是 为 了 满足 后 面 某 些 指向 常量 池 的 索引 值 的 数据 在 特定 情况 下 需要 表达 “不 引用 任何 一 个 常量 池 项 目 ”的 意思 ， 这 种 情况 就 可 以 把 索引 值 置 为 0 来 表示 。 Class 文 件 结构 中 只 有 常量 
池 的 容量 计数 是 从 1 开始 的 ， 对 于 其 他 集合 类 型 ， 包 括 接口 索引 集合 、 字 段 表 集合 、 方 法 表 集 合 等 的 容量 计数 都 与 一 般 习 惯 相同 ， 是 从 0 开始 的 。 






























































offset 1 8 9 A BC DD E F 














00000000 CA FE BA BE 00 00 00 32 00 起 07 00 02 01 00 1D 激 壕 ...2. 由 ...... 
00000010 6F 72 67 2F 66 65 6E 69 78 73 6bF 66 74 2F 63 6bC org/fenixsoft/cl 
00000020 | 6l ?A 7A 2F 54 65 73 74 04 | azz/TestClass... 
00000030 01 00 10 6A 61 76 61 2F ba ...J]java/lang/0b] 
00000040 01 69 | ect...m...1...<i 





图 6-3 


常量 池 结构 




















常量 池 之 中 主要 存放 两 大 类 常量 : 字面 量 (Literal) 和 符号 引用 (Symbolic References) 。 字 面 量 比较 接近 于 Java 语 言 层 面 的 常量 概念 ， 如 文本 字符 串 、 被 声明 为 final 的 常量 值 等 。 而 符号 引用 则 属 
于 编译 原理 方面 的 概念 ， 包 括 了 下 面 三 类 常量 : 











' 类 和 接口 的 全 限定 名 (Fully Qualified Name) 
“ 字段 的 名 称 和 描述 符 (Desctiptor) 
“方法 的 名 称 和 描述 符 


Java 代 码 在 进行 Javac 编 译 的 时 候 ， 并 不 像 C 和 C++ 那 样 有 “连接 ”这 一 步骤 ， 而 是 在 虚拟 机 加 载 Class 文 件 的 时 候 进 行动 态 连接 。 也 就 是 说 ， 在 Class 文 件 中 不 会 保存 各 个 方法 和 字段 的 最 终 内存 布 局 信 
息 ， 因 此 这 些 字段 和 方法 的 符号 引用 不 经 过 转换 的 话 是 无 法 直接 被 虚拟 机 使 用 的 。 当 虚拟 机 运行 时 ， 需 要 从 常量 池 获 得 对 应 的 符号 引用 ， 再 在 类 创建 时 或 运行 时 解析 并 翻译 到 具体 的 内 存 地 址 之 中 。 关 于 类 
的 创建 和 动态 连接 的 内 容 ， 在 下 一 章 会 有 详细 的 讲解 。 


















































常量 池 中 的 每 一 项 常量 都 是 一 个 表 ， 共 有 11 种 结构 [各 不 相同 的 表 结构 数据 ， 这 11 种 表 都 有 一 个 共同 的 特点 ， 就 是 表 开 始 的 第 一 位 是 一 个 u1 类 型 的 标志 位 (tag， 取 值 为 1 至 12， 缺 少 标志 为 2 的 数据 类 
型 ) ， 代 表 当 前 这 个 常量 属于 哪 种 常量 类 型 ，11 种 常量 类 型 所 代表 的 具体 含义 如 表 6-3 所 示 。 


























表 6-3 常量 池 的 项 目 类 型 





类 型 标志 描述 


CONSTANT Utfs info 1 ur-s 编 码 的 字符 中 | 
CONSTANT Integer_info 3 整 型 字面 量 
CONSTANT Float_info 4 浮 点 型 字面 量 
CONSTANT _ Long info 5 长 整 型 字面 量 
CONSTANT _ Double info 6 双 精 度 浮 点 型 字面 量 
CONSTANT Class_info 7 类 或 接口 的 符号 引用 
CONSTANT _ String info 8 字符 串 类 型 字面 量 
CONSTANT Fieldref info 9 字段 的 符号 引用 
CONSTANT Methodref info 10 类 中 方法 的 符号 引用 
CONSTANT InterfaceMethodref info 11 接口 中 方法 的 符号 引用 
CONSTANT NameAndType info 12 字段 或 方法 的 部 分 符号 引用 

















之 所 以 说 常量 池 是 最 繁琐 的 数据 ， 是 因为 这 11 种 常量 类 型 各 自 均 有 自己 的 结构 。 回 头 看 看 图 6-3 中 常量 池 的 第 一 项 常量 ， 它 的 标志 位 ( 偏 移 地 址 : 0x0000000A) 是 0x07， 查 看 表 6-3 的 标志 列 会 发 现 这 
个 常量 属于 CONSTANT_Class info 类 型 ， 此 类 型 的 常量 代表 一 个 类 或 接口 的 符号 引用 。CONSTANT_Class_info 的 结构 比较 简单 ， 如 表 6-4 所 示 。 


















































表 6-4 CONSTANT_Class_info 型 常量 的 结构 





类 型 名 称 数量 
ul tag 1 
u2 name index 1 





tag 是 标志 位 ， 上 面 已 经 讲解 过 了 ; name_index 是 一 个 索引 值 ， 它 指向 常量 池 中 一 个 CONSTANT_Utf8_info 类 型 的 常量 ， 此 常量 代表 了 这 个 类 (或 者 接口 ) 的 全 限定 名 ， 这 里 的 name_index 值 ( 偏 移 
地 址 : 0x0000000B) 为 0x0002， 即 指向 了 常量 池 中 的 第 二 项 常量 。 继 续 从 图 6-3 中 查找 第 二 项 常量 ， 它 的 标志 位 (地址 : 0x0000000D) 是 0x01， 查 看 表 6-3 可 知 确实 是 一 个 CONSTANT_Utf8_info 类 型 的 
常量 。CONSTANT_Utf8_info 类 型 的 结构 如 表 6-5 所 示 。 





























表 6-5 CONSTANT_Utf8_info 型 常量 的 结构 





类 型 名 称 数量 
ul tag 1 
u2 length 1 
ul bytes length 






































length 值 说 明了 这 个 UTF-8 编 码 的 字符 串 长 度 是 多 少 字 节 ， 它 后 面 紧 跟着 的 长 度 为 length 字 节 的 连续 数据 是 一 个 使 用 UTF-8 缩 略 编码 表示 的 字符 串 。UTF-8 缩 略 编码 与 普通 UTF-8 编 码 的 区 别 是 : 
从 \u0001 到 \u007f 之 间 的 字符 (相当 于 1~ 127 的 AsCll 码 ) 的 缩 略 编码 使 用 一 个 字 节 表示 ， 从 \u0080 到 \u07ff 之 间 的 所 有 字符 的 缩 略 编码 用 两 个 字 节 表示 ， 从 \u0800 开始 到 \uffff 之 间 的 所 有 字符 的 
缩 略 编码 就 按照 普通 UTF-8 编 码 规则 使 用 三 个 字 节 表 示 。 



























































顺便 提 一 下 ， 由 于 Class 文 件 中 方法 、 字 段 等 都 需要 引用 CONSTANT _Utf8_info 型 常量 来 描述 名 称 ， 所 以 CONSTANT_Utf8_info 型 常量 的 最 大 长 度 也 就 是 java 中 方法 和 字段 名 的 最 大 长 度 。 而 这 里 的 最 
大 长 度 就 是 length 的 最 大 值 ， 即 u2 类 型 能 表达 的 最 大 值 65535。 所 以 Java 程 序 中 如 果 定 义 了 超过 64KB 英 文字 符 的 变量 或 方法 名 ， 将 会 无 法 编译 。 























本 例 中 这 个 字符 串 的 length 值 〈 偏 移 地 址 : 0x0000000E) 为 0x001D， 也 就 是 长 29 个 字 节 ， 往 后 29 个 字 节 正好 都 在 1~127 的 ASCII 码 范围 以 内 ， 内 容 为 “org/fenixsoft/clazz/TestClass”， 有 兴趣 的 读 
者 可 以 自己 逐个 字 节 换算 一 下 ， 换 算 结果 如 图 6-4 选 中 的 部 分 所 示 。 

















Offset 0 1 部 DE 

00000000 (CA FE BA BE 00 00 00 32 00 16 07 00 02 01 00 1D 激 壕 ...2....,..， 
00000010 | BE 20 SN | ergaeenirsaeeel 
00000020 |61 ?A 7A 2F 54 65 73 74 43 6C 61 73 7 图 07 00 04 azz/IestClasi... 
00000030 |01 00 10 6A 61 76 61 2F 6C 61 6E 67 2F 4F 62 6A ...java/lang/0b] 





图 6-4 常量 池 UTF-8 字 符 串 结构 

















到 此 为 止 ， 我 们 分 析 了 TestClass.class 常 量 池 中 21 个 常量 中 的 两 个 ， 其 余 的 19 个 常量 都 可 以 通过 类 似 的 方法 计算 出 来 。 为 了 避免 计算 过 程 占 用 过 多 的 版 面 ， 后 续 的 19 个 常量 的 计算 过 程 可 以 借助 计算 机 
来 帮 我 们 完成 。 在 JDK 的 bin 目 录 中 ，Oracle 公 司 已 经 为 我 们 准备 好 一 个 专门 用 于 分 析 Class 文 件 字 节 码 的 工具 : javap， 代 码 清单 6-2 中 列 出 了 使 用 javap 工 具 的 -verbose 参 数 输出 TestClass.class 文 件 的 字 节 
码 内 容 (此 清单 中 省 略 了 常量 池 以 外 的 信息 ) 。 前 面 我 们 曾经 提 到 过 Class 文 件 中 还 有 很 多 数据 项 都 要 引用 常量 池 中 的 常量 ， 所 以 代码 清单 6-2 中 的 内 容 在 后 续 的 讲解 之 中 还 要 经 常 使 用 到 。 


































































































代码 清单 6-2 ”使 用 Javap 命 令 输出 常量 





C:\>javap -verbose TestClass 

Compiled from "TestClass.java" 

public class org.fenixsoft.clazz.TestClass extends java.lang.Object 
SourceFile: "TestClass.java" 


minor Version: 
major version: 
Constant pool: 


const #1 = class #2; // org/fenixsoft/clazz/TestClass 
const #2 = Asciz org/fenixsoft/clazz/TestClass; 

const #3 = class #4; // java/lang/Object 

const #4 = Asciz java/lang/Object; 

const #5 = Asciz m; 

Const #6 = Asciz I; 

const #7 = Asciz <init>; 

const #8 = Asciz ty 

const #9 = Asciz Coge; 


const #10 = Method 


const #11 = NameAndType 


#3.#11; // java/lang/Object."<init>":()V 
#7:#82// "<init>": OV 


const #12 = Asciz LineNumberTable; 
const #13 = Asciz LocalVariableTable; 
const #14 = Asciz this; 


const #15 = Asciz 
const #16 = Asciz 
const #17 = Asciz (3 

const #18 = Field #1.#19; // org/fenixsoft/clazz/TestClass.m:I 
const #19 = NameAndType #5:#6;// m:I 

const #20 = Asciz SourceFile; 

const #21 = Asciz TestClass.java; 


Lorg/fenixsoft/clazz/TestClass;; 
inc; 











从 代码 清单 6-2 中 可 以 看 到 计算 机 已 经 帮 我 们 把 整个 常量 池 的 21 项 常量 都 计算 了 出 来 ， 并 且 第 1、2 项 常量 的 计算 结果 与 我 们 手工 计算 的 结果 一 致 。 仔 细 看 一 下 会 发 现 ， 其 中 有 一 些 常量 似乎 从 来 没有 在 
代码 中 出 现 过 , 如 “lI” 、“V”、 “LocalVariableTable” 等 ， 这 些 看 起 来 在 代码 任何 一 处 都 没有 出 现 过 的 常量 是 哪里 来 的 ? 





“<init>” 、 “LineNumberTable”、 





这 部 分 自动 生成 的 常量 的 确 没 有 在 Java 代 码 里 面 直接 出 现 过 ， 但 它们 会 被 后 面 即将 讲 到 的 字段 表 (field_info) 、 方 法 表 (method info) 、 





属性 表 (attribute_info) 所 引用 到 ， 它 们 会 被 用 来 描述 一 
















































































些 不 方便 使 用 “固定 字 节 ”来 表达 的 内 容 。 壁 如 描述 方法 的 返回 值 是 什么 ? 有 几 个 参数 ? 每 个 参数 的 类 型 是 什么 ?因为 Java 中 的 “类 ”是 无 穷 无 尽 的 ， 无 法 通过 简单 的 无 符号 字 节 来 描述 一 个 方法 用 到 了 什 
么 类 ， 因 此 在 描述 方法 的 这 些 信息 时 ， 需 要 引用 常量 表 中 的 符号 引用 进行 表达 。 这 部 分 内 容 将 在 后 面 作 进一步 的 详细 阐述 。 最 后 ， 笔 者 将 11 种 常量 项 的 结构 定义 总 结 为 表 6-6 所 示 。 
表 6-6 常量 池 中 的 11 种 数据 类 型 的 结构 总 表 
常量 项 目 类 型 描述 

tag ul 值 为 1 

CONSTANT Utf8 info length u2 UTF-8 编码 的 字符 串 占用 了 字 节 数 
bytes ul 长 度 为 length 的 UTF-8 编码 的 字符 串 
tag ul 值 为 3 

CONSTANT Integer_info 一 = 
bytes u4 按照 高 位 在 前 存储 的 int 值 
tag ul 值 为 4 

CONSTANT Float info 一 SF 
bytes u4 按照 高 位 在 前 存储 的 float 值 
tag ul 值 为 5 

CONSTANT Long info 一 一 
bytes u8 按照 高 位 在 前 存储 的 long 值 
tag ul 值 为 6 

CONSTANT _ Double info 和 一 
bytes u8 按照 高 位 在 前 存储 的 double 值 
tag ul 值 为 7 

CONSTANT Class_info . 
index u2 指向 全 限定 名 常量 项 的 索引 
tag ul 值 为 8 

CONSTANT String info 
index u2 指向 字符 串 字 面 量 的 索引 
tag ul 值 为 9 
. 指向 声明 字段 的 类 或 接口 描述 符 CONSTANT 

index u2 f 

CONSTANT Fieldref info Class_info 的 索引 项 
. 指向 字段 描述 符 CONSTANT NameAndType 的 索 
index u2 引 项 一 



































常量 项 目 类 型 描述 
tag ul 值 为 10 
A 指向 声明 方法 的 类 描述 符 CONSTANT _Class_info 
CONSTANT Methodref info a . 的 索引 项 
. 指向 名 称 及 类 型 描述 符 CONSTANT NameAndType 
index u2 
的 索引 项 
tag ul 值 为 11 
pe 指 癌 声明 方法 的 接口 描述 符 CONSTANT _Class_info 
CONSTANT InterfaceMethodref info 0 . 的 索引 项 
有 指向 名 称 及 类 型 描述 符 CONSTANT NameAndType 
index u2 
的 索引 项 
tag ul 值 为 12 
CONSTANT NameAndType info index u2 指向 该 字段 或 方法 名 称 常量 项 的 索引 
index u2 指向 该 字段 或 方法 描述 符 常 量 项 的 索引 





6.3.3 ”访问 标志 


在 常量 池 结 束 之 后 ， 紧 接着 的 2 个 字 节 代表 访问 标志 (access flags) ， 这 个 标志 
类 型 ;如 果 是 类 的 话 ， 是 否 被 声明 为 final， 等 等 。 具 体 的 标志 位 及 标志 的 含义 见 表 6-7。 





























于 识别 一 些 类 或 接口 层次 的 访问 信息 ， 包 括 : 这 个 Class 是 类 还 是 接口 ， 是 否定 义 为 public 类 型 ; 是 否定 义 为 abstract 























表 6-7 访问 标志 





标志 名 称 标志 值 含 义 

ACC_PUBLIC Ox0001 是 否 为 public 类 型 

ACC FINAL 0x0010 是 否 被 声明 为 final， 只 有 类 可 设置 

ACC SUPER 0x0020 是 否 人 允许 使 用 invokespecial 字 节 码 指 令 ，JDK 1.2 之 后 
编译 出 来 的 类 的 这 个 标志 为 真 

ACC INTERFACE 0x0200 标识 这 是 一 个 接口 

ACC ABSTRACT 0x0400 是 否 为 abstract 类 型 ， 对 于 接口 或 抽象 类 来 说 ， 此 标志 
值 为 真 ， 其 他 类 值 为 假 

ACC SYNTHETIC 0x1000 标识 这 个 类 并 非 由 用 户 代码 产生 的 

ACC_ANNOTATION 0x2000 标识 这 是 一 个 注解 

ACC ENUM 0x4000 标识 这 是 一 个 枚 举 








access flags 中 一 共有 32 个 标志 位 可 以 使 用 ， 当 前 只 定义 了 其 中 的 8 个 向 ， 没 有 使 



































到 的 标志 位 要 求 一 律 为 0。 以 代码 清单 6-1 中 的 代码 为 例 ，TestClass 这 个 类 被 public 关 键 字 修饰 但 没有 被 声明 为 final 








和 abstract， 并 且 它 使 用 了 JDK 1.2 之 后 的 编译 器 进行 编译 ， 因 此 它 的 ACC_PUBLIC、ACC_SUPER 标 志 应 当 为 真 , 而 ACC FINAL、ACC INTERFACE、ACC ABSTRACT、ACC _SYNTHETIC、 
ACC_ANNOTATION、ACC_ENUM 这 六 个 标志 应 当 为 假 ， 因 此 它 的 access flags 的 值 应 为 : 0x0001|0x0020=0x0021。 从 图 6-5 中 可 以 看 到 ，access flags 标 志 ( 偏 移 地 址 : 0x000000EF) 的 确 为 


























Ox0021。 
000000DO ‘06 01 00 0Oa 53 6F 75 72 63 65 46 69 6C 65 01 00 ....SourceFile.. 
O00000E0 (OE 54 65 73 74 43 6C 61 73 73 2E 6a 61 76 61 00 .TestClass.]java. 
000000F0 | 一 00 01 00 03 00 00 00 01i 00 02 00 05 00 06 00 | 国 ............... 


00000100 





6.3.4 ”类 索引 、 父 类 索引 与 接口 索引 集合 


类 索引 (this_class) 和 父 类 索引 (super_class) 都 是 一 个 u2 类 型 的 数 提 


00 00 02 00 01 00 07 00 





居 ， 而 接口 索引 集合 (interfaces) 是 一 组 u2 类 型 的 数据 的 集合 ，Class 文 件 中 由 这 三 项 数据 来 确定 这 个 类 的 继承 关系 。 类 索引 











08 00 04. .00 .09 00 00 00 | sm 5 2 ii s 





图 6-5 access_flags 标 志 















































于 确定 这 个 类 的 全 限定 名 ， 父 类 索引 用 于 确定 这 个 类 的 父 类 的 全 限定 名 。 由 于 Java 语 言 不 允许 多 重 继承 ， 所 以 父 类 索引 只 有 一 个 ， 除 了 java.lang.Object 之 外 ， 所 有 的 Java 类 都 有 父 类 ， 因 此 除了 
java.lang.Object 外 ， 所 有 Java 类 的 父 类 索引 都 不 为 0。 接 口 索引 集合 就 用 来 描述 这 个 类 实现 了 哪些 接口 ， 这 些 被 实现 的 接口 将 按 implements 语 句 (如 果 这 个 类 本 身 是 一 个 接口 ， 则 应 当 是 extends 语 句 ) 后 
的 接口 顺序 从 左 到 右 排列 在 接口 的 索引 集合 中 。 



























































类 索引 、 父 类 索引 和 接口 索引 集合 都 按 顺序 排列 在 访问 标志 之 后 ， 类 索引 和 父 类 索引 用 两 个 u2 类 型 的 索引 值 表 示 ， 它 们 各 自 指 向 一 个 类 型 为 CONSTANT_Class_ info 的 类 描述 符 常量 ， 通 过 
CONSTANT Class info 类 型 的 常量 中 的 索引 值 可 以 找到 定义 在 CONSTANT_Utf8_info 类 型 的 常量 中 的 全 限定 名 字符 串 。 图 6-6 演 示 了 代码 清单 6-1 的 代码 的 类 索引 查找 过 程 。 


























bytes:orgrfenixsoft clazz 
/TestClass 





图 6-6 ”类 索引 查找 全 限定 名 的 过 程 




















对 于 接口 索引 集合 ， 入 口 的 第 一 项 一 一 u2 类 型 的 数据 为 接口 计数 器 (interfaces_ count) ， 表 示 索 引 表 的 容量 。 如 果 该 类 没有 实现 任何 接口 ， 那 么 该 计数 器 值 为 0， 后 面 接口 的 索引 表 不 再 占用 任何 字 
节 。 代 码 清单 6-1 中 的 代码 的 类 索引 、 父 类 索引 与 接口 表 索 引 的 内 容 如 图 6-7 所 示 。 























000000DO |06 01 00 OA 53 6F 75 72 63 65 46 69 bc 65 01 00 |....SourceFile.. 
D000000E0 |0E 54 65 73 74 43 6C 6l 73 73 2E 6A 6b1 76 6l 00 | .TestClass.java. 
000000F0 | 21 NNN o0 01 00 02 00 05 00 06 00 | (RN......... 
00000100 00 00 02 00 '01 00 07 00 0800 01 00' 站 9 "00 00 00 | 3 a Min valde 





图 6-7 类 索引 、 父 类 索引 、 接 口 索 引 集 合 





从 偏 移 地 址 9x000000F1 开 始 的 3 个 u2 类 型 的 值 分 别 为 0x0001、0x0003 和 0x0000， 也 就 是 类 索引 为 1， 父 类 索引 为 3， 接 口 索 引 集 合 大 小 为 0%， 查 询 前 面 代码 清单 6-2 中 javap 命 令 计 算出 来 的 常量 池 ， 找 
出 对 应 的 类 和 父 类 的 常量 ， 结 果 如 代码 清单 6-3 所 示 。 














代码 清单 6-3 ”部 分 常量 池 的 内 容 





const #1 = class #2; // org/fenixsoft/clazz/TestClass 
Const #2 = Asciz org/fenixsoft/clazz/TestClass; 
const #3 = class #4; // java/lang/Object 


const #4 = Asciz java/lang/Object; 





6.3.5 “字段 表 集 合 




















字段 表 (field_info) 用 于 描述 接口 或 类 中 声明 的 变量 。 字 段 (field) 包括 了 类 级 变量 或 实例 级 变量 ， 但 不 包括 在 方法 内 部 声明 的 变量 。 我 们 可 以 想 一 想 在 java 中 描述 一 个 字段 可 以 包含 什么 信息 ”可 以 
包括 的 信息 有 : 字段 的 作用 域 (public、private、protected 修 饰 符 ) 、 是 类 级 变量 还 是 实例 级 变量 (static 修 饰 符 ) 、 可 变性 (final) 、 并 发 可 见 性 (volatile 修 饰 符 ， 是 否 强制 从 主 内 存 读 写 ) 、 可 否 序 
列 化 (transient 修 饰 符 ) 、 字 段 数据 类 型 (基本 类 型 、 对 象 、 数 组 ) 、 字 段 名称 。 这 些 信息 中 ， 各 个 修饰 符 都 是 布尔 值 ， 要 么 有 某 个 修饰 符 ， 要 么 没有 ， 很 适合 使 用 标志 位 来 表示 。 而 字段 叫 什么 名 字 、 字 
段 被 定义 为 什么 数据 类 型 ， 这 些 都 是 无 法 国定 的 ， 只 能 引用 常量 池 中 的 常量 来 描述 。 表 6-8 中 列 出 了 字段 表 的 最 终 格式 。 



















































































表 6-8 字段 表 结 构 


类 型 名 称 数 量 
u2 access flags 1 
u2 name index 1 
u2 descriptor_index 1 
u2 attributes_count 1 
attribute_info attributes attributes_count 



































字段 修饰 符 放 在 access flags 项 目 中 ， 它 与 类 中 的 access flags 项 目 是 非常 类 似 的， 都 是 一 个 u2 的 数据 类 型 ， 其 中 可 以 设置 的 标志 位 和 含义 如 表 6-9 所 示 。 














表 6-9 ”字段 访问 标志 





标志 名 称 标志 值 含 义 





ACC PUBLIC 0x0001 字段 是 否 public 

ACC PRIVATE 0x0002 字段 是 否 pravate 

ACC PROTECTED Ox0004 字段 是 否 protected 

ACC STATIC 0x0008 字段 是 否 static 

ACC FINAL 0x0010 字段 是 否 final 

ACC _ VOLATILE 0x0040 字段 是 否 volatile 

ACC TRANSIENT Ox0080 字段 是 否 transient 

ACC SYNTHETIC 0x1000 字段 是 否 由 编译 器 自动 产生 的 
ACC_ENUM 0x4000 字段 是 否 enum 





很 明显 ， 在 实际 情况 中 ，ACC_PUBLIC、ACC_PRIVATE、ACC_PROTECTED 三 个 标志 最 多 只 能 选择 其 一 ，ACC_FINAL、ACC_VOLATILE 不 能 同时 选择 。 接 口 之 中 的 字段 必须 有 ACC_PUBLIC、 
ACC_STATIC、ACC_FINAL 标 志 ， 这 些 都 是 由 Java 本 身 的 语言 规则 所 决定 的 。 














跟随 access flags 标 志 的 是 两 项 索引 值 : name_index 和 和 descriptor_index。 它 们 都 是 对 常量 池 的 引用 ， 分 别 代表 着 字段 的 简单 名 称 及 字段 和 方法 的 描述 符 。 现 在 需要 解释 一 下 “简单 名 称 ”、“ 描 述 
符 ” 及 前 面 出 现 过 多 次 的 “全 限定 名 ”这 三 种 特殊 字符 串 的 概念 。 





限定 名 和 简单 名 称 很 好 理解 ， 以 代码 清单 6-1 中 的 代码 为 例 ，“org/fenixsoft/clazz/TestClass” 是 这 个 类 的 全 限定 名 ， 仅 仅 是 把 类 全 名 中 的 “.” 蔡 换 成 了 “/” 而 已 ， 为 了 使 连续 的 多 个 全 限定 名 之 
间 不 产生 混淆 ， 在 使 用 时 最 后 一 般 会 加 入 一 个 “; ”号 表示 全 限定 名 结束 。 简 单 名 称 则 就 是 指 没有 类 型 和 参数 修饰 的 方法 或 字段 名 称 ， 这 个 类 中 的 inc0 方 法 和 m 字 段 的 简单 名 称 分 别 是 “inc” 和 “m”。 












































相对 于 全 限定 名 和 简单 名 称 来 说 ,方法 和 字段 的 描述 符 就 要 复杂 一 些 。 描 述 符 的 作用 是 用 来 描述 字段 的 数据 类 型 、 方 法 的 参数 列表 (包括 数量 、 类 型 以 及 顺序 ) 和 返回 值 。 根 据 描述 符 规则 ， 基 本 数据 
类 型 (byte、char、double、float、int、long、short、boolean) 及 代表 无 返回 值 的 void 类 型 都 用 一 个 大 写字 符 来 表示 ， 而 对 象 类 型 则 用 字符 L 加 对 象 的 全 限定 名 来 表示 ， 详 见 表 6-10。 














表 6-10 ”描述 符 标识 字符 含义 








标识 字符 2 Ww 

B 基本 类 型 byte 

C 基本 类 型 char 

D 基本 类 型 double 

FE 基本 类 型 float 

I 基本 类 型 int 

J 基本 类 型 long 
基本 类 型 short 

乙 基本 类 型 boolean 

V® 特殊 类 型 void 

L 对 象 类 型 ， 如 Ljava/lang/Object: 


注 : void 类 型 在 虚拟 机 规范 之 中 单独 列 出 为 “VoidDescriptor”， 笔 者 为 了 结构 统一 ， 将 其 列 在 基本 数据 类 型 中 一 起 描述 。 




















对 于 数组 类 型 ， 每 一 维度 将 使 用 一 个 前 置 的 “[” 字 符 来 描述 ， 如 一 个 定义 为 “java.lang.String[][0” 类 型 的 二 维 数组 ， 将 被 记录 为 : “[[Ljava/lang/String; ”， 一 个 整 型 数组 “int[]” 将 被 记录 
为 “I 

















描述 符 来 描述 方法 时 ， 按 照 先 参数 列表 ， 后 返回 值 的 顺序 描述 ， 参 数列 表 按照 参数 的 严格 顺序 放 在 一 组 小 括号 “(0” 之 内 。 如 方法 void inc(0 的 描述 符 为 “0V”， 方法 java.lang.String toString() 的 描 
述 符 为 “(0Ljava/lang/String; ”， 方法 int indexOf(char[]source, int sourceOffset，int sourceCount，char[ltarget，int targetOffset，int targetCount，int fromlndex) 的 描述 符 
为 “([Cll[CIIDI” 。 




















对 于 代码 清单 6-1 中 的 TestClass.class 文 件 来 说 ， 字 段 表 集合 从 地 址 0x000000F8 开 始 ， 第 一 个 u2 类 型 的 数据 为 容量 计数 器 fields_count， 如 图 6-8 所 示 ， 其 值 为 0xX0001， 说 明 这 个 类 只 有 一 个 字段 表 数 
据 。 接 下 来 紧 跟着 容量 计数 器 的 是 access flags 标 志 ， 值 为 0x0002， 代 表 private 修 饰 符 的 ACC_PRIVATE 标 志 位 为 真 (ACC_PRIVATE 标 志 的 值 为 0x0002) ， 其 他 修饰 符 为 假 。 代 表 字 段 名 称 的 hame_index 
的 值 为 0x0005， 从 代码 清单 6-2 列 出 的 常量 表 中 可 查 得 第 五 项 常量 是 一 个 CONSTANT_Utf8_info 类 型 的 字符 串 ， 其 值 为 “m” ， 代 表 字 段 描述 符 的 descriptor_index 的 值 为 0x0006， 指 向 常量 池 的 字符 
串 “|”， 根 据 这 些 信息 ， 我 们 可 以 推断 出 原 代码 定义 的 字段 为 “private int m;“ 


























000000D0 06 01 00 OA 53 6F 75 72 63 65 46 69 6C 65 01 00 | ,,. ,SourceFile. 。 
O00000E0 0E 54 65 73 74 43 EC bl 73 73 2E ba bl yb 6l 00 | .TestClass.]java. 


000000F0 |21 00 01 00 03 00 00 Wumeun es 00 | | .... . .Mm . 
00000100 00 00 02 00 01 00 07 00 08 + 00409 人 OO | si ve 


fields count 





name_ index 


tor_index 


access_flaegs descrl 








字段 表 都 包含 的 固定 数据 项 目 到 descriptor_ index 为 止 就 结束 了 ， 不 过 在 descriptor_ index 之 后 跟随 着 一 个 








图 6-8 字段 表 结 构 实例 











属性 表 集 合 j 











于 存储 一 些 额外 的 信息 ， 字 段 都 可 以 在 属性 表 中 描述 0 至 多 项 额外 的 信息 。 对 于 











本 例 中 的 字段 m， 它 的 属性 表 计 数 器 为 0， 也 就 是 没有 需要 额外 描述 的 信息 ， 但 是 ， 如 果 将 字段 m 的 声明 改 为 “final static int m=123; ”， 那 就 可 能 会 存在 一 项 名 为 ConstantValue 的 属性 ， 其 值 指向 常量 
123。 关 于 attribute_info 的 其 他 内 容 ， 将 在 6.3.7 节 介绍 属性 表 的 数据 项 目 时 再 进一步 讲解 。 


字段 表 集 合 中 不 会 列 出 从 超 类 或 父 接口 





Java 语 言 中 字段 是 无 法 重 载 的 





6.3.6 方法 表 集 合 


如 果 理解 了 上 一 节 关于 字段 表 的 内 容 ， 那 本 节 关 于 方法 表 的 内 容 
包括 了 访问 标志 (access flags) 、 名 称 索引 (name_index) 、 描 述 符 索引 (descriptor index) 、 


表 集合 的 可 选项 中 有 所 区 别 。 

















中 继承 而 来 的 字段 ， 但 有 可 能 列 出 原本 Java 代 码 之 中 不 存在 的 字段 ， 





， 两 个 字段 的 数据 类 型 、 修 饰 符 不 管 是 否 相同 ， 都 必须 使 























辟 如 在 内 部 类 中 为 了 保持 对 外 部 类 的 访问 性 ， 会 自动 添加 指向 外 部 类 实例 的 字段 。 另 外 ,在 
不 一 样 的 名 称 ， 但 是 对 于 字 节 码 来 讲 ， 如 果 两 个 字段 的 描述 符 不 一 致 ， 那 字段 重 名 就 是 合法 的 。 








会 变 得 很 简单 。 Class 文 件 存储 格式 中 对 方法 的 描述 与 对 字段 的 描述 几乎 采 
属性 表 集 合 (attributes) 几 项 ， 如 表 6-11 所 示 。 这 些 数 据 项 

















了 完全 一 致 的 方式 ， 方 法 表 的 结构 如 同 字段 表 一 样 ， 依 次 
的 含义 非常 类 似 ， 仅 在 访问 标志 和 属性 
































表 6-11 方法 表 结构 
类 型 名 称 数 量 
u2 access flags 1 
u2 name index 1 
u2 descriptor_index 1 
u2 attributes_count 1 


attribute_info 


attributes 


attributes_count 








因为 volatile 关 键 字 和 transient 关 键 字 不 能 修饰 方法 ， 所 以 方法 表 的 访问 标志 中 没有 了 ACC_VOLATILE 标 志和 ACC_TRANSIENT 标 志 。 与 之 相对 的 ，synchronized、native、strictfp 和 abstract 关 键 字 





可 以 修饰 方法 ， 所 以 方法 表 的 访问 标志 中 增加 了 ACC_SYNCHRONIZED、ACC_NATIVE、ACC_STRICTFP 和 ACC_ABSTRACT 标 志 。 对 于 方法 表 ， 所 有 标志 位 及 其 取 值 可 参见 表 6-12。 


表 6-12 方法 访问 标志 





标志 名 称 
ACC_PUBLIC 
ACC_PRIVATE 


ACC. PROTECTED 


ACC_STATIC 


ACC_FINAL 


ACC_ SYNCHRONIZED 
ACC_BRIDGE 
ACC_VARARGS 


ACC_NAIIV 


E 


ACC_ABSTRACT 
ACC_STRICT 
ACC_SYNTHETIC 


行文 至 此 ， 也 许 有 的 读者 会 产生 疑问 ， 方 法 的 定义 可 以 通过 访问 标志 、 
属性 表 作 为 Class 文 件 格式 中 最 





方法 属性 表 和 集合 中 一 个 名 为 “Code” 的 








属性 里 面 ， 





名 称 索引 、 描 述 符 索引 表达 清楚 ， 


标志 值 
0x0001 
0x0002 
0x0004 
0x0008 
0x0010 
0x0020 
0x0040 
0x0080 
0x0100 
0x0400 
0x0800 
0x1000 

















扩 

















我 们 继续 以 代码 清单 6-1 中 的 Class 文 件 为 例 对 方法 表 集 合 进行 分 析 ， 如 图 6-9 所 示 ， 
个 方法 (这 两 个 方法 为 编译 器 添加 的 实例 构造 器 <init> 和 源码 中 的 方法 inc0) 。 第 一 个 方法 的 访问 标志 值 为 0x001， 也 就 是 只 有 ACC_PUBLIC 标 志 为 真 ， 名 称 索 引 值 为 0x0007， 查 看 代码 清单 6-2 的 常量 池 可 




















方法 表 集合 的 入 











但 方法 里 面 的 代码 去 哪里 了 ?方法 里 的 Java 代 码 ， 
展 性 的 一 种 数据 项 目 ， 将 在 6.3.7.1 节 中 详细 讲解 。 


含 义 
方法 是 否 为 public 
方法 是 否 为 private 
方法 是 否 为 protected 
方法 是 否 为 static 
方法 是 否 为 final 
方法 是 否 为 synchronized 
方法 是 否 是 由 编译 器 产生 的 桥接 方法 
方法 是 否 接 受 不 定 参 数 
方法 是 否 为 native 
方法 是 否 为 abstract 
方法 是 否 为 strictfp 
方法 是 否 是 由 编译 器 自动 产生 的 


经 过 编译 器 编译 成 字 节 码 指令 之 后 ， 存 放 在 


地 址 为 : 0x00000101， 第 一 个 u2 类 型 的 数据 (既是 计数 器 容量 ) 的 值 为 0x0002， 代 表 集 合 中 有 两 


























得 方法 名 为 “<init>” ， 描 述 符 索引 值 为 0x0008， 对 应 常量 为 “0V” ， 属 性 表 计数 器 attributes count 的 值 为 0x0001 就 表示 此 方法 的 属性 表 集 合 有 一 项 属性 ， 属 性 名 称 索 引 为 0x0009， 对 应 常量 
为 “Code” ， 说 明 此 属性 是 方法 的 字 节 码 描述 。 
000000FD |21 00 01 00.03:00.0000 01 00 02 00 05 00 06 100 1 byes veer 
00000100 | 00 [oo 02Ioo 0dlioo 07lIoo 08lIoo oi1llo0 03 00 00 00| . 
00000110 00| 7/........ ?7.7... 


name_1lndex 


descr 


2F 00fol 00401 00foo 00 村 05 28MB7 00 人 0a B1 00 


methods_count 


attributes count 


iptor_ index 


attribute name index 





图 6-9 ”方法 表 结 构 实例 





与 字段 表 集 合 相 对 应 的 ， 如 果 父 类 方法 在 子 类 中 没有 被 重 写 (Override) ， 方 法 表 集合 中 就 不 会 出 现 来 自 父 类 的 方法 信息 。 但 同样 的 ， 有 可 能 会 出 现 由 编译 器 


“<clinit>” 方 法 和 实例 构造 器 “<init>” 方 法 Bl]。 
































在 Java 语 言 中 ， 要 重 载 (Overload) 一 个 方法 ， 除 了 要 与 原 方法 








有 相同 的 简 和 














引用 的 集合 ， 也 就 是 因为 返回 值 不 会 包含 在 特征 签名 之 中 ， 














此 Java 语 言 里 面 是 无 法 仅仅 依靠 返回 值 的 不 | 








符 不 是 完全 一 致 的 两 个 方法 也 可 以 共存 。 也 就 是 说 ， 如 果 两 个 方法 有 相 


6.3.7 ”属性 表 集 合 














与 Class 文 件 中 其 他 的 数据 项 
可 以 向 属性 表 中 写 入 自己 定义 的 
表 6-13 所 示 。 后 文中 将 对 这 9 种 





要 求 严格 的 顺序 、 长 度 和 内 容 不 同 ， 





























属性 逐一 进行 讲解 口 。 





同 的 名 称 和 特征 签名 ， 但 返回 值 不 


属性 表 (attribute_info) 在 前 面 的 讲解 之 中 已 经 出 现 过 数 次 ， 在 Class 文 件 、 字 段 表 、 方 法 表 中 都 可 以 携带 自 





名 称 之 外 ， 还 要 求 必须 拥有 一 个 与 原 方法 不 同 





















































更 大 一 些 ， 


动 添加 的 方法 ， 最 典型 的 便 是 类 构造 


的 特征 签名 向 ， 特 征 签名 就 是 一 个 方法 中 各 个 参数 在 常量 池 中 的 字段 符号 
同 来 对 一 个 已 有 方法 进行 重 载 的 。 但 是 在 Class 文 件 格式 之 中 ， 特 征 签名 的 范围 


只 要 描述 





同 ， 那 么 也 是 可 以 合法 共存 于 同一 个 Class 文 件 中 的 。 














0 











的 属性 表 和 集合， 以 











于 描述 某 些 场景 专 有 的 信息 。 














属性 表 集合 的 限制 稍微 宽松 了 一 些 ， 不 再 要 求 各 个 属性 表 
属性 信息 ，Java 虚 拟 机 运行 时 会 忽略 掉 它 不 认识 的 





属性 。 为 了 能 正确 地 解析 Class 文 件 ， 


表 6-13 虚拟 机 规范 预定 义 的 属性 
































《Java 虚 拟 机 规范 (第 2 版 )》 中 预定 义 了 9 项 虚拟 机 实现 应 当 能 识别 的 


有 严格 的 顺序 ， 并 且 只 要 不 与 已 有 的 属性 名 重复 ， 任 何人 实现 的 编译 器 都 




















属性 ， 具 体 如 











属性 名 称 使 用 位 置 

Code 方法 表 
ConstantValue 字段 表 

Deprecated 类 、 方 法 表 、 字 段 表 
Exceptions 方法 表 

InnerClasses 类 文件 
LineNumberTable Code 属性 
LocalVariableTable Code 属性 
SourceFile 类 文件 

Synthetic 类 、 方 法 表 、 字 上段 表 


含 


Java 代码 编译 成 的 字 节 码 指令 

final 关键 字 定 义 的 常量 

被 声明 为 deprecated 的 方法 和 字段 
方法 抛 出 的 异常 

内 部 类 列表 

Java 源码 的 行 号 与 字 节 码 指令 的 对 应 关系 
方法 的 局 部 变量 描述 

源 文件 名 称 

标识 方法 或 字段 为 编译 器 自动 生成 的 


义 



































对 于 每 个 属性 ， 它 的 名 称 需 要 从 常量 池 中 引用 一 个 CONSTANT _Utf8_info 类 型 的 常量 来 表示 ， 而 属性 值 的 结构 则 是 完全 自 定义 的 ， 只 需要 说 明 属 性 值 所 占用 的 位 数 长 度 即 可 。 一 个 符合 规则 的 属性 表 应 
该 满足 表 6-14 中 所 定义 的 结构 。 
表 6-14 属性 表 结 构 
类 型 名 称 数 量 
u2 attribute_name index 1 
u2 attribute_lenght 1 
ul info attribute_lenght 








1.Code 属 性 


Java 程 序 方法 体 里 面 的 代码 经 过 Javac 编 译 器 处 理 之 后 ， 最 终 变 为 字 节 码 指令 存储 在 Code 属 性 内 。Code 属 性 出 现在 方法 表 的 属性 集合 之 中 ， 但 并 非 所 有 的 方法 表 都 必须 存在 这 个 属性 ， 壁 如 接 














类 中 的 方法 就 不 存在 Code 属 性 ， 如 果 方 法 表 有 Code 属 性 存在 ， 那 么 它 的 结构 将 如 表 6-15 所 示 。 





表 6-15 Code 属 性 表 的 结构 











或 抽象 























类 型 名 称 数 量 
u2 attribute_name index 1 
u4 attribute_length 1 
u2 max _ stack 1 
u2 max locals 1 
u4 code length 1 
ul code code length 
u2 exception table length 1 


exception_ info 
u2 


attribute_info 


exception table 


attributes_count 


attributes 


exception table length 
1 


attributes_count 























attribute_ name _index 是 一 项 指向 CONSTANT _Utf8_info 型 常量 的 索引 ， 常 量 值 固定 为 “Code” ， 它 代表 了 该 属性 的 属性 名 称 ，attribute_length 指 示 了 属性 值 的 长 度 ， 由 于 属性 名 称 索引 与 属性 长 
度 一 共 是 6 个 字 节 ， 所 以 属性 值 的 长 度 固 定 为 整个 属性 表 的 长 度 减 去 6 个 字 节 。 














max_stack 代 表 了 操作 数 栈 (Operand Stacks) 深度 的 最 大 值 。 在 方法 执行 的 任意 时 刻 ， 操 作 数 栈 都 不 会 超过 这 个 深度 。 虚 拟 机 运行 的 时 候 需要 根据 这 个 值 来 分 配 栈 帧 (Frame) 中 的 操作 栈 深度 。 




















max locals 代 表 了 局 部 变量 表 所 需 的 存储 空间 。 在 这 里 ，max_locals 的 单位 是 Slot，Slot 是 虚拟 机 为 局 部 变量 分 配 内 存 所 使 用 的 最 小 单位 。 对 于 byte、char、float、int、short、boolean、reference 
和 returnAddress 等 长 度 不 超过 32 位 的 数据 类 型 ， 每 个 局 部 变量 占用 1 个 slot， 而 double 和 long 这 两 种 64 位 的 数据 类 型 则 需要 2 个 Slot 来 存放 。 方 法 参数 (包括 实例 方法 中 的 隐藏 参数 “this”) 、 显 式 异 常 
处 理 器 的 参数 (Exception Handler Parameter， 即 try-catch 语 句 中 catch 块 所 定义 的 异常 ) 、 方 法 体 中 定义 的 局 部 变量 都 需要 使 用 局 部 变量 表 来 存放 。 另 外 ， 并 不 是 在 方法 中 用 到 了 多 少 个 局 部 变量 ， 就 
把 这 些 局 部 变量 所 占 的 Slot 之 和 作为 max_locals 的 值 ， 原 因 是 局 部 变量 表 中 的 Slot 可 以 重用 ， 当 代码 执行 超出 一 个 局 部 变量 的 作用 域 时 ， 这 个 局 部 变量 所 占 的 Slot 就 可 以 被 其 他 局 部 变量 所 使 用 ， 编 译 器 会 根 
据 变量 的 作用 域 来 分 类 Slot 并 分 配给 各 个 变量 使 用 ， 然 后 计算 出 max_locals 的 大 小 。 

























































































































































































code length 和 code 用 来 存储 Java 源 程序 编译 后 生成 的 字 节 码 指 令 。code_length 代 表 字 节 码 长 度 ，code 是 用 于 存储 字 节 码 指 令 的 一 系列 字 节 流 。 既 然 名 为 字 节 码 指令 ， 那 么 每 个 指令 就 是 一 个 u1 类 型 
的 单字 节 ， 当 虚拟 机 读 取 到 code 中 的 一 个 字 节 码 时 ， 就 可 以 相应 地 找 出 这 个 字 节 码 代表 的 是 什么 指令 ， 并 且 可 以 知道 这 条 指令 后 面 是 否 需要 跟随 参数 ， 以 及 参数 应 当 如 何 理解 。 我 们 知道 一 个 u1 数 据 类 型 的 
取 值 范围 为 0x00 至 0xFF， 对 应 十 进 制 的 0~255， 也 就 是 一 共 可 以 表达 256 条 指令 。 目 前 ，Java 虚 拟 机 规范 已 经 定义 了 其 中 约 200 条 编码 值 对 应 的 指令 含义 ， 编 码 与 指令 之 间 的 对 应 关系 可 查阅 本 书 的 附录 
B “虚拟 机 机 字 节 码 指令 : 





























关于 code length， 还 有 一 件 值得 注意 的 事情 ， 虽 然 它 是 一 个 u4 类 型 的 长 度 值 ， 理 论 上 最 大 值 可 以 达到 232-1， 但 是 虚拟 机 规范 中 限制 了 一 个 方法 不 允许 超过 65535 条 字 节 码 指令 ， 如 果 超 过 这 个 限 
制 ，Javac 编 译 器 就 会 拒绝 编译 。 一 般 来 讲 ， 只 要 我 们 写 Java 代 码 时 不 是 刻意 去 编写 超 长 的 方法 ， 就 不 会 超过 这 个 最 大 值 的 限制 。 但 是 ， 在 编译 复杂 的 JSP 文 件 时 ， 可 能 会 因为 这 个 原因 而 导致 编译 失败 。 





























Code 属 性 是 Class 文 件 中 最 重要 的 一 个 属性 ， 如 果 把 一 个 Java 程 序 中 的 信息 分 为 代码 (Code， 方 法 体 里 面 的 Java 代 码 ) 和 元 数据 (Metadata， 包 括 类 、 字 段 、 方 法 定义 及 其 他 信息 ) 两 部 分 ， 那 么 在 
整个 Class 文 件 里 ，Code 属 性 用 于 描述 代码 ， 所 有 的 其 他 数据 项 目 就 都 用 于 描述 元 数据 ， 了 解 Code 属 性 是 学 习 后 面 两 章 关 于 字 节 码 执行 引擎 内 容 的 必要 基础 ， 直 接 阅 读 字 节 码 也 是 工作 中 分 析 jJava 代 码 语义 
问题 的 必要 工具 ， 因 此 笔者 准备 了 一 个 比较 详细 的 实例 来 讲解 虚拟 机 是 如 何 使 用 这 个 属性 的 。 








































































































继续 以 代码 清单 6-1 的 TestClass.class 文 件 为 例 ， 如 图 6-10 所 示 ， 这 是 上 一 节 分 析 过 的 实例 构造 器 “<init>” 方 法 的 Code 属 性 。 它 的 操作 数 栈 的 最 大 深度 和 本 地 变量 表 的 容量 都 为 0x0001， 字 节 码 区 域 
所 占 空间 的 长 度 为 0x0005。 虚 拟 机 读 取 到 字 节 码 区 域 的 长 度 后 ， 按 照 顺 序 依次 读 入 紧 随 的 5 个 字 节 ， 并 根据 字 节 码 指令 表 翻 译 出 所 对 应 的 字 节 码 指令 。“2A B7000A B1” 的 翻译 过 程 为 : 




















1) 读 入 2A， 查 表 得 0x2A 所 对 应 的 指令 为 aload_0， 这 个 指令 的 含义 是 将 第 0 个 Slot 中 为 reference 类 型 的 本 地 变量 推送 至 栈 顶 。 














2) 读 入 B7， 查 表 得 0xB7 所 对 应 的 指令 为 invokespecial， 这 条 指令 的 作用 是 以 栈 顶 的 reference 类 型 的 数据 所 指向 的 对 象 作为 方法 接收 者 ， 调 用 此 对 象 的 实例 构造 器 方法 、private 方 法 或 其 父 类 的 方 
法 。 这 个 方法 有 一 个 u2 类 型 的 参数 说 明 具 体 调 用 哪 一 个 方法 ， 它 指向 常量 池 中 的 一 个 CONSTANT_Methodref info 类 型 常量 ， 即 此 方法 的 的 方法 符号 引用 。 







































































3) 读 入 000A， 这 是 invokespecial 的 参数 ， 查 常量 池 得 0x000A 对 应 的 常量 为 实例 构造 器 “<init>” 方 法 的 符号 引用 。 











4) 读 入 B1， 查 表 得 0xB1 对 应 的 指令 为 return， 含 义 是 返回 此 方法 ， 并 且 返 回 值 为 void。 这 条 指令 执行 后 ， 当 前 方法 结束 。 


























000000F0 21 00 01 00 03 00 00 00 01 00 02 00 05 00 06 00 1....,..,....，. 
00000100 |00 00 02 00 01 00 07 00 08 00 01 00 09 00 00 00 ................ 
00000110 |2F [oo olliloo oullloo oo 00 os)l2a B7 00 0A BI 00 00 | 7 .. 
00000120 |00 02A00 DeAo0 00 004o6 00 01 004o0 00 03 00 0D | .........,....,. 


max_stack code leneth code 














mar_locals 





图 6-10 ”Code 属 性 结构 实例 








这 段 字 节 码 虽然 很 短 ， 但 是 可 以 看 出 它 执行 过 程 中 的 数据 交换 、 方 法 调用 等 操作 都 是 基于 栈 (操作 栈 ) 进行 的 。 我 们 可 以 初步 猜测 : Java 虚 拟 机 执行 字 节 码 是 基于 栈 的 体系 结构 。 但 是 与 一 般 基 于 堆栈 
的 零 字 节 指 令 又 不 太一 样 ， 某 些 指令 (如 invokespecial) 后 面 还 会 带 有 参数 ， 关 于 虚拟 机 字 节 码 执行 的 讲解 是 后 面 两 章 的 重点 ， 我 们 不 妨 把 这 里 的 疑问 放 到 第 8 章 去 解决 。 









































我 们 再 次 使 用 javap 命 令 把 此 Class 文 件 中 的 另外 一 个 方法 的 字 节 码 指令 也 计算 出 来 ， 结 果 如 代码 清单 6-4 所 示 。 














代码 清单 6-4 用 Javap 命 令 计算 字 节 码 指令 














// 原始 Java 代 码 

Public class TestClass { 
Private int my 
public int inc() { 

Feturn m + 17 

} 

} 

:\>javap -verbose TestClas 


CN lass 
// 常量 表 部 分 的 输出 见 代码 清单 6-1， 因 版 面 原 因 在 此 省 略 掉 。 
{ 


public org.fenixsoft.clazz.TestClass (); 

Code: 

Stack=1，Locals=1，RArgs_size=1 

0: aload 0 

1: invokespecial #10; //Method java/lang/Object."<init>":()V 
> return 

LineNumberTable: 

line 3: 0 

LocalVariableTable: 

Start Length Slot Name Signature 

0 5 0 this Lorg/fenixsoft/clazz/TestClass; 

public int inc(); 

Code: 

Stack=2, Locals=1, Args size=]l 

0: aload 0 

1: getfield #18; //Field m:I 

4: iconst 1 

Et iadd 

Bs ireturn 

LineNumberTable: 

line 8: 

LocalVariableTable: 

Start Length Slot Name Signature 

0 7 0 this Lorg/fenixsoft/clazz/TestClass; 


} 





如 果 大 家 注意 到 javap 中 输出 的 “Args size” 的 值 ， 可 能 会 有 疑问 : 这 个 类 有 两 个 方法 一 一 实例 构造 器 <init> 0 和 inc(0)， 这 两 个 方法 很 明显 都 是 没有 参数 的 ， 为 什么 Args_ size 会 为 1 而 且 无 论 是 在 参数 


列表 里 还 是 方法 体内 ， 都 没有 定义 任何 





局 部 变量 ， 那 Locals 又 为 什么 会 等 于 1? 如 果 有 这 样 的 疑问 ， 大 家 可 能 是 忽略 了 一 点 : 在 任何 实例 方法 中 ， 都 可 以 通过 “this” 关 键 字 访 问 到 此 方法 所 属 的 对 象 。 这 个 














访问 机 制 对 Java 程 序 的 编写 很 重要 ， 而 它 的 实现 却 非常 简单 ， 仅 仅 是 通过 Javac 编 译 器 在 编译 的 时 候 把 对 this 关 键 字 的 访问 转变 为 对 一 个 普通 方法 参数 的 访问 ， 然 后 在 虚拟 机 调用 实例 方法 时 自动 传 入 此 参数 



























































即 可 。 因 此 在 实例 方法 的 局 部 变量 表 中 至 少 会 存在 一 个 指向 当前 对 象 实例 的 局 部 变量 ， 








效 ， 如 果 代 码 清单 6-1 中 的 inc() 方 法 被 声明 为 static， 那 Args_size 就 不 会 等 于 1 而 是 等 了 









































0 了 。 








在 字 节 码 指令 之 后 的 是 这 个 方法 的 显 式 异常 处 理 表 (以 下 简称 异常 表 ) 集合 ， 异 常 表 对 于 Code 























家 部 变量 表 中 也 会 预 留 出 第 一 个 Slot 位 来 存放 对 象 实例 的 引用 ， 方 法 参数 值 从 1 开始 计算 。 这 个 处 理 只 对 实例 方法 有 














属性 来 说 并 不 是 必须 存在 的 ， 如 代码 清单 6-4 中 就 没有 异常 表 生成 。 





异常 表 的 格式 如 表 6-16 所 示 ， 它 包含 四 个 字段 ， 这 些 字段 的 含义 为 : 如 果 字 节 码 从 第 start_pc 行 (9 到 第 end_pc 行 之 间 (不 含 第 end_pc 行 ) 出 现 了 类 型 为 catch_type 或 其 子 类 的 异常 (catch_type 为 指 


向 一 个 CONSTANT_Class_info 型 常量 的 索引 ) ， 风 


异常 表 实 际 上 是 Java 代 码 的 一 部 分 ， 编 译 器 使 用 异常 表 而 不 是 简单 的 跳 转 命令 来 实现 Java 异 常 及 finally 处 理 机 制 ， 代 码 清单 6-5 是 一 段 演 示 异 常 表 如 何 运作 的 例子 ， 这 段 代 码 同时 也 演示 字 节 码 





























的 try-catch-finally 是 如 何 实现 的 。 阅 读 字 节 码 之 前 ， 大 家 不 妨 先 看 看 下 面 的 Java 源 码 
































表 6-16 属性 表 结 构 


转 到 第 handler_pc 行 继续 处 理 。 当 catch_type 的 值 为 O 时 ， 代 表 任 何 的 异常 情况 都 需要 转向 到 handler_pc 处 进行 处 理 。 














加 
了 











， 想 一 下 这 段 代码 的 返回 值 在 出 现 异常 和 不 出 现 异常 的 情况 下 分 别 应 为 多 少 ? 








类 型 名 称 数 量 
u2 start_pc 1 
u2 end_pc I 
u2 handler pc 1 
u2 catch type 1 





代码 清单 6-5 ”异常 表 运作 演示 


// Java 源 码 
public int inc() { 
int x; 


return x; 


} catch (Exception e) { 
X= 27 


return x; 


} finally { 


} 


X= 3; 


} 
// 编译 后 的 ByteCode 字 节 码 及 异常 表 
Public int jnct) > 

Code: 

Stack=1, Locals=5, Args size=]l 


JAWNPO 


iconst 1  // try 拨 中 的 x=1l 


istore 1 

iload 1 // 保存 x 到 returnValue 中 ， 此 时 x=1 
istore 4 

iconst 3  // finaly 块 中 的 x=3 

istore 1 


iload “4  // 将 returnValue 中 的 值 放 到 栈 项 ， 准 备 给 ireturn 返 回 
ireturn 


astore 2 // 给 catch 中 定义 的 Exception e 赋 值 ， 存 储 在 Slot 2 中 
iconst 2 // catch 块 中 的 x=2 

istore 1 

iload 1 // 保存 x 到 returnValue 中 ， 此 时 x=2 

istore 4 

iconst 3 // finaly 块 中 的 x=3 

istore 1 


iload “4  // 将 returnValue 中 的 值 放 到 栈 项 ， 准 备 给 ireturn 返 回 
ireturn 


astore 3 // 如 果 出 现 了 不 属于 java.1lang .Exception 及 其 子 类 的 异常 才 会 走 到 这 里 


iconst 3 // finaly 块 中 的 x=3 
istore 1 
aload 3 // 将 异常 放置 到 栈 顶 ， 并 抛 出 


athrow 


Exception table: 
from to target type 


0 
0 
10 


5 10 Class java/lang/Exception 
5 21 any 
16 “2 any 





编译 器 为 这 段 Java 源 码 生成 了 三 条 异常 表 记录 ， 对 应 三 条 可 能 出 现 的 代码 执行 路 径 。 从 Java 代 码 的 语义 上 讲 ， 这 三 条 执行 路 径 分 别 为 : 


“ 如 果 tty 语句 块 中 出 现 属 于 Exception 或 其 子 类 的 异常 ， 则 转 到 catch 语 句 块 处 理 。 


: 如 果 try 语 句 块 中 出 现 不 属于 Exception 或 其 子 类 的 异常 ， 则 转 到 finally 语 句 块 处 理 。 


“ 如 果 catch 语 句 块 中 出 现任 何 异 常 ， 则 转 到 finally 语 句 块 处 理 。 




















返回 到 我 们 上 面 提出 的 问题 ， 这 段 代 码 的 返回 值 应 该 是 多 少 ? 熟悉 Java 语 言 的 读者 应 该 很 容易 就 能 说 出 答案 : 如 果 没 有 出 现 异常 ， 则 返回 值 是 1;， 如 果 出 现 了 Exception 异 常 ， 则 返回 值 是 2;， 如 果 出 现 
了 Exception 以 外 的 异常 ， 则 方法 非 正常 退出 ,没有 返回 值 。 我 们 一 起 来 分 析 一 下 字 节 码 的 执行 过 程 ， 从 字 节 码 的 层面 上 来 看 看 为 何 会 有 这 样 的 返回 结果 。 


字 节 码 中 第 0 至 4 行 所 做 的 




















回 值 来 使 


最 后 ireturn 指 令 会 以 int 的 形式 返回 操作 栈 顶 中 的 值 ， 方 法 结束 。 如 果 出 现 了 异常 ，PC 寡 存 器 指针 转 到 第 10 行 ， 第 10 至 20 行 所 做 的 


将 变量 x 的 值 改 为 3。 方 法 返回 前 同样 是 将 returnValue 中 保留 的 整数 2 读 到 操作 栈 顶 。 从 第 21 行 开始 的 代码 ， 作 


尽管 大 家 都 知道 这 段 代 码 出 现 异 常 的 概率 非常 的 小 ， 但 是 并 不 影响 它 为 我 们 演示 




















操作 就 是 将 整数 1 赋值 给 变量 x， 并 且 将 此 时 x 的 值 复制 一 份 副本 到 最 后 一 个 本 地 变量 表 的 Slot 中 (这 个 Slot 




















面 的 值 在 ireturn 指 令 执 行 前 将 会 被 重新 读 到 操作 栈 项 ， 作 为 方法 返 


。 为 了 讲解 方便 ， 笔 者 给 这 个 Slot 取 名 为 : returnValue) 。 如 果 这 时 候 没 有 出 现 异常 ， 则 会 继续 走 到 第 5 至 9 行 ， 将 变量 x 赋值 为 3， 然 后 将 之 前 保存 在 returnValue 中 的 整数 1 读 入 到 操作 栈 顶 ， 









































有 情 是 将 2 赋值 给 变量 x， 然 后 将 变量 x 此 时 的 值 赋 给 returnValue， 最 后 再 
是 将 变量 x 的 值 赋 为 3， 并 将 栈 顶 的 异常 地 出 ， 方 法 结束 。 
































书 第 8 章 “虚拟 机 字 节 码 执行 引擎 ”中 将 会 有 更 详细 的 讲解 。 





2.Exceptions 属 性 

















这 里 的 Exceptions 属 性 是 在 方法 表 中 与 Code 属 性 平 级 的 一 项 属性 ， 读 者 不 要 与 前 
Excepitons) ， 也 就 是 方法 描述 时 在 throws 关 键 字 后 面 列举 的 异常 。 它 的 结构 如 表 6-17 所 示 。 











面 刚刚 讲解 完 的 异常 表 产 生 混淆 。Exceptions 





表 6-17 属性 表 结 构 








异常 表 的 作用 。 如 果 大 家 到 这 里 仍然 对 字 节 码 的 运作 过 程 比较 模糊 ， 其 实 也 不 要 紧 ， 关 于 虚拟 机 执行 字 节 码 的 过 程 ， 本 














属性 的 人 和 








是 列举 出 方法 中 可 能 抛 出 的 受 查 异 常 (Checked 





类 
册 


u2 
u4 
u2 


u2 


名 称 数 量 
attribute name index 1 
attribute_length 1 
number of exceptions 1 
exception index table number of exceptions 














此 属性 中 的 number_of_exceptions 项 表示 方法 可 能 抛 出 number_of_exceptions 种 受 查 异常 ， 每 一 种 受 查 异常 使 用 一 个 exception_index_table 项 表示 ，exception_index_table 是 一 个 指向 常量 池 中 
CONSTANT_Class_info 型 常量 的 索引 ， 代 表 了 该 受 查 异常 的 类 型 。 


3.LineNumberTable 属 性 
































LineNumberTable 属 性 用 于 描述 Java 源 码 行 号 与 字 节 码 行 号 ( 字 节 码 的 偏 移 量 ) 之 间 的 对 应 关系 。 它 并 不 是 运行 时 必需 的 属性 ， 但 默认 会 生成 到 Class 文 件 之 中 ， 可 以 在 Javac 中 使 用 -g: none 或 -g: 
lines 选 项 来 取消 或 要 求生 成 这 项 信息 。 如 果 选 择 不 生成 LineNumberTable 属 性 ， 对 程序 运行 产生 的 最 主要 的 影响 就 是 在 抛 出 异常 时 ， 堆 栈 中 将 不 会 显示 出 错 的 行 号 ， 并 且 在 调试 程序 的 时 候 无 法 按照 源码 来 





设置 断 点 。LineNumberTable 属 性 的 结构 如 表 6-18 所 示 。 
类 型 
u2 
u4 
u2 


line_ number_info 




















表 6-18 ”LineNumberTable 属 性 结构 


名 称 数 量 
attribute_ name index 1 
attribute_length 1 
line number table length 1 
line number table line number table length 


line_number table 是 一 个 数量 为 line_number table_ length、 类 型 为 line_number_info 的 集合 ，line_number_info 表 包括 了 start_pc 和 line_number 两 个 u2 类 型 的 数据 项 ， 前 者 是 字 节 码 行 号 ， 后 者 


是 Java 源 码 行 号 。 


4.LocalVariableTable 属 性 




















LocalVariableTable 属 性 用 于 描述 栈 帧 中 局 部 变量 表 中 的 变量 与 Java 源码 中 定义 的 变量 之 间 的 关系 ， 它 不 是 运行 时 必需 的 属性 ， 默 认 也 不 会 生成 到 Class 文 件 之 中 ， 可 以 在 Javac 中 使 用 -g: none 或 -g: 
vars 选 项 来 取消 或 要 求生 成 这 项 信息 。 如 果 没 有 生成 这 项 属性 ， 最 大 的 影响 就 是 当 其 他 人 引用 这 个 方法 时 ， 所 有 的 参数 名 称 都 将 丢失 ，1DE 可 能 会 使 用 诸如 arg0、arg1 之 类 的 占 位 符 来 代 蔡 原 有 的 参数 名 ， 
这 对 程序 运行 没有 影响 ， 但 是 会 给 代码 编写 带 来 较 大 的 不 便 ， 而 且 在 调试 期 间 调试 器 无 法 根据 参数 名 称 从 运行 上 下 文中 获得 参数 值 。LocalVariableTable 属 性 的 结构 如 表 6-19 所 示 。 















































表 6-19 LocalVariableTable 属 性 结构 








类 型 名 称 数 量 
u2 attribute_name index 1 
u4 attribute_length 1 
u2 local variable table length 1 
local variable_ info local variable table local variable table length 




















start_pc 和 length 属 性 分 别 代表 了 这 个 局 部 变量 的 生命 周期 开始 的 字 节 码 偏 移 量 及 : 


其 中 local_variable info 项 目 代表 了 一 个 栈 帧 与 源码 中 的 局 部 变量 的 关联 ， 结 构 如 表 6-20 所 示 。 




















作用 范围 覆盖 的 长 度 ， 两 者 结合 起 来 就 是 这 个 局 部 变量 在 字 节 码 之 中 的 作用 域 范围 。 





























name_index 和 descriptor_ index 都 是 指向 常量 池 中 CONSTANT_Utf8_info 型 常量 的 索引 ， 分 别 代表 了 局 部 变量 的 名 称 及 该 局 部 变量 的 描述 符 。 


表 6-20 ”local_variable_info 项 目 结构 





类 型 名 称 数 量 
u2 start_pc 1 
u2 length 1 
u2 name_ index 1 
u2 descriptor_index 1 
u2 index 1 
































index 是 这 个 局 部 变量 在 栈 帧 局 部 变量 表 中 Slot 的 位 置 。 当 这 











顺便 提 一 下 ， 在 JDK 1.5 引 入 泛 型 之 后 ，LocalVariableTable 





个 变量 的 数据 类 型 是 64 位 类 型 时 (double 和 long) ， 它 占用 的 Slot 为 index 和 index+ 1 两 个 位 置 。 
































属性 增加 了 一 个 “姐妹 属性 ”: LocalVariableTypeTable， 这 个 新 增 的 属性 结构 与 LocalVariableTable 非 常 相似 ， 仪 仅 是 把 记录 的 字段 描述 


符 的 descriptor_ index 蔡 换 成 了 字段 的 特征 签名 (Signature) ， 对 于 非 泛 型 类 型 来 说 ,描述 符 和 特征 签名 能 描述 的 信息 基本 是 一 致 的 ， 但 是 引入 泛 型 之 后 ， 由 于 描述 符 中 泛 型 的 参数 化 类 型 被 擦 除 掉 [8] 了 ， 
描述 符 就 不 能 准确 地 描述 泛 型 类 型 了 ， 因 此 出 现 了 LocalVariableTypeTable。 








5.SourceFile 属 性 























SourceFile 属 性 用 于 记录 生成 这 个 Class 文 件 的 源码 文件 名 称 。 这 个 属性 也 是 可 选 的 ， 可 以 使 用 Javac 的 -g: none 或 -g: Source 选项 来 关闭 或 要 求生 成 这 项 信息 。 在 Java 中 ， 对 于 大 多 数 的 类 来 说 ， 类 名 
和 文件 名 是 一 致 的 ， 但 是 有 一 些 特殊 情况 (如 内 部 类 ) 例外 。 如 果 不 生成 这 项 属性 ， 当 抛 出 异常 时 ， 堆 栈 中 将 不 会 显示 出 错误 代码 所 属 的 文件 名 。 这 个 属性 是 一 个 定 长 的 属性 ， 其 结构 如 表 6-21 所 示 。 
































表 6-21 SourceFile 属 性 结构 








类 型 名 称 数 量 
u2 attribute name index 1 
u4 attribute_length 1 
U2 sourcefile_index 1 





sourcefile_index 数 据 项 是 指向 常量 池 中 CONSTANT_Utf8_info 型 常量 的 索引 ， 常 量 值 是 源码 文件 的 文件 名 。 


6.ConstantValue 属 性 
































ConstantValue 属 性 的 作用 是 通知 虚拟 机 自动 为 静态 变量 赋值 。 只 有 被 static 关 键 字 修饰 的 变量 (类 变量 ) 才 可 以 使 用 这 项 属性 。 在 Java 程 序 里 面 类 似 “int x=123” 和 “static int x=123” 这 样 的 变量 
定义 是 非常 常见 的 事情 ， 但 虚拟 机 对 这 两 种 变量 赋值 的 方式 和 时 刻 都 有 所 不 同 。 对 于 非 static 类 型 的 变量 (也 就 是 实例 变量 ) 的 赋值 是 在 实例 构造 器 <init> 方 法 中 进行 的 ， 而 对 于 类 变量 ， 则 有 两 种 方式 可 以 
选择 : 赋值 在 类 构造 器 <clinit> 方 法 中 进行 ， 或 者 使 用 ConstantValue 属 性 来 赋值 。 目 前 Sun Javac 编 译 器 的 选择 是 : 如 果 同 时 使 用 final 和 static 来 修饰 一 个 变量 (或 者 说 常量 更 贴切 ) ， 并 且 这 个 变量 的 数 
据 类 型 是 基本 类 型 或 java.lang.String 的 话 ， 就 生成 ConstantValue 属 性 来 进行 初始 化 ， 如 果 这 个 变量 没有 被 final 修 饰 ， 或 者 并 非 基本 类 型 及 字符 串 ， 则 选择 在 <clinit> 方 法 中 进行 初始 化 。 














































































































虽然 有 final 关 键 字 才 更 符合 “ConstantValue” 的 语义 ， 但 虚拟 机 规范 中 并 没有 强制 要 求 字段 必须 设置 了 ACC_FINAL 标 志 ， 只 要 求 了 有 ConstantValue 属 性 的 字段 必须 设置 ACC_STATIC 标 志 ， 对 final 
关键 字 的 要 求 是 Javac 编 译 器 自己 加 入 的 限制 。 而 ConstantValue 的 属性 值 则 只 限于 基本 类 型 和 String， 不 过 笔者 不 认为 这 是 什么 限制 ， 因 为 此 属性 的 属性 值 只 是 一 个 常量 池 的 索引 号 ， 由 于 Class 文 件 格式 
的 常量 类 型 中 只 有 与 基本 属性 和 字符 串 相 对 应 的 字面 量 ， 所 以 就 算 ConstantValue 属 性 想 支 持 别 的 类 型 也 无 能 为 力 ，ConstantValue 属 性 的 结构 如 表 6-22 所 示 。 































































































表 6-22 ConstantValue 属 性 结构 





类 型 名 称 数 量 
u2 attribute_ name index 1 
u4 attribute_length 1 
u2 constantvalue_index 1 






































从 数据 结构 中 可 以 看 出 ConstantValue 属 性 是 一 个 定 长 属性 ， 它 的 attribute_length 数 据 项 值 必须 固定 为 2。constantvalue_index 数 据 项 代表 了 常量 池 中 一 个 字面 量 常量 的 引用 ， 根 据 字段 类 型 的 不 
同 ， 字 面 量 可 以 是 CONSTANT Long _info、CONSTANT Float info、CONSTANT_Double info、CONSTANT Integer info 和 CONSTANT _String_info 常 量 中 的 一 种 。 









































7.InnerClasses 属 性 


























InnerClasses 属 性 用 于 记录 内 部 类 与 宿主 类 之 间 的 关联 。 如 果 一 个 类 中 定义 了 内 部 类 ， 那 编译 器 将 会 为 它 及 它 所 包含 的 内 部 类 生成 InnerClasses 属 性 。 属 性 的 结构 如 表 6-23 所 示 。 








表 6-23 ”InnerClasses 属 性 结构 








类 型 名 称 数 量 
u2 attribute_name index 1 
u4 attribute_length 1 
u2 number of classes 1 
inner classes_info inner classes number of classes 





数据 项 number_of_classes 代 表 需 要 记录 多 少 个 内 部 类 信息 ， 每 一 个 内 部 类 的 信息 都 由 一 个 inner_classes_info 表 进行 描述 。inner_classes_info 表 的 结构 如 表 6-24 所 示 。 


表 6-24 inner_classes_info 表 的 结构 





类 型 名 称 数 量 
u2 inner_class_info_index 1 
u2 outer_class_info_index 1 
u2 inner name index 1 
u2 inner_ class_ access flags 1 

















inner_class_info_index 和 outer_class_info_index 都 是 指向 常量 池 中 CONSTANT_Class_info 型 常量 的 索引 ， 分 别 代 表 了 内 部 类 和 宿主 类 的 符号 引用 。 


inner_name_index 是 指向 常量 池 中 CONSTANT_Utf8_info 型 常量 的 索引 ， 代 表 这 个 内 部 类 的 名 称 ， 如 果 是 匿名 内 部 类 ， 则 这 项 值 为 0。 








inner_class_access flags 是 内 部 类 的 访问 标志 ， 类 似 于 类 的 access flags， 它 的 取 值 范围 如 表 6-25 所 示 。 




















8.Deprecated 及 Synthetic 属性 





























Deprecated 和 Synthetic 两 个 属性 都 属于 标志 类 型 的 布尔 属性 ， 只 存在 有 和 没有 的 区 别 ， 没 有 属性 值 的 概念 。 


















































Deprecated 属 性 用 于 表示 某 个 类 、 字 段 或 方法 ， 已 经 被 程序 作者 定 为 不 再 推荐 使 用 ， 它 可 以 通过 在 代码 中 使 用 @deprecated 注 释 进行 设置 。 


表 6-25 inner_class_access_flags 标 志 








标志 名 称 标志 值 含 义 
ACC PUBLIC 0x0001 内 部 类 是 否 为 public 
ACC_PRIVATE 0x0002 内 部 类 是 否 为 private 
ACC PROTECTED 0x0004 内 部 类 是 否 为 protected 
ACC_STATIC 0x0008 内 部 类 是 否 为 static 
ACC_FINAL 0x0010 内 部 类 是 否 为 final 
ACC INTERFACE 0x0020 内 部 类 是 否 为 synchronized 
ACC ABSTRACT 0x0400 内 部 类 是 否 为 abstract 
ACC_SYNTHETIC Ox1000 内 部 类 是 否 并 非 由 用 户 代码 产生 的 
ACC_ ANNOTATION 0x2000 内 部 类 是 否 是 一 个 注解 
ACC_ENUM 0x4000 内 部 类 是 否 是 一 个 枚 举 














Synthetic 属性 代表 此 字段 或 方法 并 不 是 由 Java 源 码 直接 产生 的 ， 而 是 由 编译 器 自行 添加 的 ， 在 JDK 1.5 之 后 ， 标 识 一 个 类 、 字 段 或 方法 是 编译 器 自动 产生 的 ， 也 可 以 设置 它们 访问 标志 中 的 
ACC_SYNTHETIC 标 志 位 ， 其 中 最 典型 的 例子 就 是 Bridge Method。 所 有 由 非 用 户 代码 产生 的 类 、 方 法 及 字段 都 应 当 至 少 设置 Synthetic 属性 和 ACC_SYNTHETIC 标 志 位 中 的 一 项 ， 唯 一 的 例外 是 实例 构造 
器 “<init>” 方 法 和 类 构造 器 “<clinit>” 方 法 。 







































































Deprecated 和 Synthetic 属性 的 结构 非常 简单 ， 如 表 6-26 所 示 。 





表 6-26 ”Deprecated 及 Synthetic 属性 的 结构 


类 型 名 称 数 量 
u2 attribute_ name index 1 
u4 attribute_length 1 




















其 中 attribute_length 数 据 项 的 值 必须 为 0x00000000， 因 为 没有 任何 属性 值 需要 设置 。 








1] JDK 1.7 中 为 了 实现 JSR-292 规 范 《Supporting Dynamically Typed Languages on the Java Platform》， 很 可 能 会 添加 CONSTANT _InvokeDynamic 和 CONSTANT _InvokeDynamicTrans 这 两 个 常量 类 型 ， 这 两 个 常量 
在 目前 的 OpenJDK 7 的 代码 中 已 存在 ， 但 由 于 JDK 1.7 正 式 版 尚未 发 布 ， 本 书 暂 不 计算 这 两 个 常量 。 

2] 在 Java 虚 拟 机 规范 中 ， 只 定义 了 开头 5 种 标志 。]JDK 1.5 中 增加 了 后 面 3 种 。 这 些 标 志 在 JSR-202 规 范 中 声明 ， 是 对 《Java 虚拟 机 规范 〈 第 2 版 ) 》 的 补充 。 本 书 介绍 的 访问 标志 以 JSR-202 规范 为 准 。 

3] <init> 和 <cinit> 的 详细 内 容 见 本 书 的 第 10 章 。 

4 在 《Java 虚拟 机 规范 (第 2 版 )》 的 “$4.4.4 Signatures” 章 节 及 《Java 语言 规范 (第 3 版 ) 》 的 “§ 8.4.2 Method Signature” 章 节 中 都 分 别 定 义 了 字 节 码 层 面 的 方法 特征 签名 及 Java 代 码 层面 的 方法 特征 签 
名 ，Java 代 码 的 方法 特征 签名 只 包括 了 方法 名 称 、 参 数 顺序 及 参数 类 型 ， 而 字 节 码 的 特征 签名 还 包括 方法 返回 值 及 受 查 异 常 表 ， 请 读者 根据 上 下 文 语 境 注 意 区 分 。 

5] 随 着 JD 区 版 本 的 发 展 ，JCP 也 通过 发 布 JSR 规范 的 方式 保持 着 对 《Java 虚拟 机 规范 (第 2 版 )》 的 更 新 。 在 尚 处 于 草稿 状态 的 《Java 虚拟 机 规范 《第 3 版 ) 》 中 ， 属 性 表 集合 的 预定 义 内容 已 增加 到 19 项 。 由 
于 篇 幅 的 关系 ， 本 书 介绍 Class 格 式 中 的 属性 表 部 分 时 仍然 以 《Java 虚拟 机 规范 〈 第 2 版 ) 》 为 基准 ， 但 会 在 最 后 一 节 集中 描述 这 些 新 加 入 的 信息 ， 并 且 后 面 在 讲解 JDK 1.5 和 JDK 1.6 相 对 于 JDK 1.4 的 改进 和 优 
化 时 ， 将 会 重新 提 及 这 些 新 加 入 的 特性 。 而 在 介绍 Class 文 件 格式 的 其 他 部 分 时 ， 将 以 JSR-202 中 对 虚拟 机 规范 的 最 新 补充 为 基准 。 

6] 此 处 字 节 码 的 “ 行 ” 是 一 种 形象 的 描述 ， 指 的 是 字 节 码 相对 于 方法 体 开始 的 偏 移 量 ， 而 不 是 Java 源 码 的 行 号 ， 下 同 。 

7] 在 JDK1.4.2 之 前 的 Javac 编 译 器 采用 了 jstr 和 tet 指令 实现 finally 语 句 ， 但 在 1.4.2 之 后 就 已 经 改 为 异常 表 实 现 了 。 

8] 详 见 第 10 章 中 关于 语法 糖 部 分 的 内 容 。 








6.4 Class 文件 结构 的 发 展 











Class 文 件 结构 自 Java 虚 拟 机 规范 第 一 版 订立 以 来 ， 已 经 有 十 多 年 的 历史 。 这 十 多 年 间 ，Java 技 术 体系 有 了 翻天 覆 地 的 改变 ，JDK 的 版 本 号 已 经 从 1.0 提 升 到 了 1.7。 相 对 于 语言 、API 及 Java 技 术 体系 中 其 
他 方面 的 变化 ，Class 文 件 结构 一 直 处 于 一 个 相对 比较 稳定 的 状态 ，Class 文 件 的 主体 结构 几乎 没有 发 生 过 变化 ， 对 Class 文 件 格式 的 改进 都 集中 在 向 访问 标志 、 属 性 表 这 些 在 设计 上 本 就 可 扩展 的 数据 结构 中 
添加 内 容 。 



























































如 果 以 《Java 虚 拟 机 规范 (第 2 版 ) 》 为 基准 进行 比较 的 话 ， 在 后 续 JDK 的 发 展 中 ， 访 问 标志 里 新 加 入 了 ACC_SYNTHETIC、ACC_ANNOTATION、ACC_ENUM、ACC_BRIDGE、ACC_VARARGS 共 五 
个 标志 ， 这 些 标志 的 意义 和 作用 在 前 面 已 经 介绍 过 。 















































而 属性 表 集 合 中 ， 在 JDK 1.5 和 JDK 1.6 版 本 内 一 共 增 加 了 10 项 新 的 属性 。 这 些 属性 的 名 称 及 具体 作用 可 以 参见 表 6-27。 





表 6-27 JDK 1.5 和 ]JDK 1.6 中 添加 的 属性 


属性 名 称 使 用 位 置 含义 


JDK 1.6 中 添加 的 属性 ， 为 了 加 快 Class 文件 的 校 验 速度 ， 把 
StackMapTable Code 属性 类 型 校 验 时 需要 用 到 的 相关 信息 直接 写 入 到 了 Class 文件 中 ， 以 
前 这 些 信息 都 是 通过 代码 数据 流 分 析 得 到 的 


JDK 1.5 中 添加 的 属性 ， 当 一 个 类 为 局 部 类 或 匿名 类 时 ， 可 通 
过 这 个 属性 来 声明 其 访问 范围 


JDK 1.5 中 添加 的 属性 ， 存 储 类 、 方 法 、 字 有 段 的 特征 签名 。 
四 。 | JDK 1.5 引入 泛 型 是 Java 语言 的 一 个 巨大 进步 ， 虽 然 使 用 了 类 型 
Signature ee ”| 擦 除 手段 以 避免 在 字 节 码 级 别 产生 改变 ， 但 是 元 数据 中 的 泛 型 信 
息 仍 然 需要 保留 下 来 ， 而 这 种 情况 下 描述 符 再 无 法 精确 地 描述 谤 
型 信息 ， 因 此 添加 了 这 个 特征 签名 属性 


JDK 1.6 中 添加 的 属性 ，SourceDebugExtension 属性 用 于 存储 
额外 的 调试 信息 。 壁 如 在 进行 JSP 文件 调试 时 ， 无 法 通过 Java 
堆栈 来 定位 到 JSP 文件 的 行 号 ，JSR-45 规范 为 这 些 非 Java 语言 
编写 ， 却 需要 编译 成 字 节 码 并 运行 在 Java 虚拟 机 中 的 程序 提供 
了 一 个 进行 调试 的 标准 机 制 ， 使 用 SourceDebugExtension 属性 
就 可 以 用 于 存储 这 个 标准 所 新 加 入 的 调试 信息 


JDK 1.5 中 添加 的 属性 ， 其 作用 在 上 文 讲 解 LocalVariableTable 
LocalVariableTypeTable 类 属性 的 时 候 已 经 提 到 过 ， 它 使 用 特征 签名 代替 描述 符 ， 是 为 了 引 
入 泛 型 语法 之 后 能 描述 泛 型 参数 化 类 型 而 添加 的 


JDK 1.5 中 添加 的 属性 ， 为 动态 注解 提供 支持 。RuntimeVisible 


EnclosingMethod 类 


SourceDebugExtension 类 


RuntimeVisibleAnnotations 类 、 方 法 表 、 Annotations 属性 的 用 于 指明 哪些 注解 是 运行 时 (实际 上 运行 时 








oe 就 是 进行 反射 调用 ) 可 见 的 
ati GT vis le ationes 类 、 方 法 表 、 JDK 1.5 中 添加 的 属性 ， 与 RuntimeVisibleAnnotations 属性 的 
字段 表 作用 刚好 相反 ， 用 于 指明 哪些 注解 是 运行 时 不 可 见 的 
RuntimeVisibleParameter 方法 表 JDK 1.5 中 添加 的 属性 ， 作 用 与 RuntimeVisibleAnnotations 属 
oe l 性 类 似 ， 只 不 过 作用 对 象 为 方法 参数 
RuntimeInvisibleParameter 方法 表 JDK 1.5 中 添加 的 属性 ， 作 用 与 RuntimeInvisibleAnnotations 
A bs 属性 类 似 ， 只 不 过 作用 对 象 为 方法 参数 
AnnotationDefault 方法 表 JDK 1.5 中 添加 的 属性 ， 用 于 记录 注解 类 元 素 的 默认 值 











上 面 这 些 属性 大 部 分 用 于 支持 java 中 许多 新 出 现 的 语言 特性 ， 如 枚 举 、 变 长 参数 、 泛 型 、 动 态 注解 等 。 还 有 一 些 是 为 了 支持 性 能 改进 和 调试 信息 ， 警 如 JDK 1.6 的 新 类 型 校 验 器 使 用 的 StackMapTable 
属性 和 对 非 Java 代 码 调试 中 用 到 的 SourceDebugExtension 属 性 。 在 本 书后 面 的 两 章 中 ， 我 们 还 会 接触 到 这 些 新 加 入 的 高 级 特性 。 


























6.5 “本章 小 结 











Class 文 件 是 Java 虚 拟 机 执行 引擎 的 数据 入 口 ， 也 是 Java 技 术 体系 的 基础 支柱 之 一 。 了 解 Class 文 件 的 结构 对 后 面 进一步 了 解 虚拟 机 执行 引 殉 有 很 重要 的 意义 。 

















本 章 详细 讲解 了 Class 文 件 结构 中 的 各 个 组 成 部 分 ， 以 及 每 个 部 分 的 定义 、 数 据 结构 和 使 用 方法 。 通 过 代码 清单 6-1 的 Java 代 码 与 它 的 Class 文 件 样 例 ， 以 实战 的 方式 演示 了 Class 的 数据 是 如 何 存储 和 访 
间 的 。 从 下 一 章 开始 ， 我 们 将 以 动态 的 、 运 行 时 的 角度 去 看 看 字 节 码 流 在 虚拟 机 执行 引擎 中 是 怎样 被 解释 执行 的 。 














第 7 章 ”虚拟 机 类 加 载 机 制 


本 章 主要 内 容 

“ 概述 

“ 类 加 载 的 时 机 
“ 类 加 载 的 过 程 


“ 类 加 载 器 





代码 编译 的 结果 从 本 地 机 器 码 转变 为 字 节 码 ， 是 存储 格式 发 展 的 一 小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


7.1 概述 























上 一 章 我 们 了 解 了 Class 文 件 存储 格式 的 
拟 机 后 会 发 生 什 么 变化 ? 这 些 都 是 本 章 将 要 讲解 的 内 容 。 






































虚拟 机 把 描述 类 的 数据 从 Class 文 件 加 载 到 内 存 ， 并 对 数据 进行 校 验 、 转 换 解析 和 初始 化 ， 最 终 形成 可 以 被 虚拟 机 直接 使 


与 那些 在 编译 时 需要 进行 连接 工作 的 语言 不 同 ， 在 Java 语 言 里 面 ， 类 型 的 加 载 和 连接 过 程 都 是 在 程序 运行 期 间 完 成 的 ， 这 样 会 在 类 加 载 时 稍微 增加 一 些 性 能 开销 ， 但 是 却 能 为 Java 应 




















的 Java 类 型 ， 这 就 是 虚拟 机 的 类 加 载 机 制 。 


体 细节 ， 在 Class 文 件 中 描述 的 各 种 信息 ， 最 终 都 需要 加 载 到 虚拟 机 中 之 后 才能 被 运行 和 使 用 。 而 虚拟 机 如 何 加 载 这 些 Class 文 件 ”Class 文 件 中 的 信息 进入 到 虚 











程序 提供 高 度 的 























接口 的 应 








灵活 性 ，Java 中 天 生 可 以 动态 扩展 的 语言 特性 就 是 依赖 运行 期 动态 加 载 和 动态 连接 这 个 特点 实现 的 。 例 如 ， 如 果 编 写 一 个 使 











方式 广泛 应 用 于 Java 程 序 之 中 。 








为 了 避免 语言 表达 中 可 能 产生 的 偏差 ， 在 本 章 正式 开始 之 前 ， 笔 者 先 设立 两 个 语言 上 的 约定 : 第 一 ， 在 实际 情况 中 ， 每 个 Class 文 件 都 有 可 能 代表 着 Java 语 言 中 的 一 个 类 或 接 
描述 都 包括 了 类 和 接口 的 可 能 性 ， 而 对 于 类 和 接口 需要 分 开 描 述 的 场景 会 特别 指明 ; 第 二 ， 笔 者 所 说 的 “Class 文 件 ” 并 非 指 Class 必 须 是 存在 于 











制 的 字 节 流 ， 无 论 以 何 种 形式 存在 都 可 以 。 


7.2 ”类 加 载 的 时 机 


程序 ， 可 以 等 到 运行 时 再 指定 其 实际 的 实现 。 这 种 组 装 应 

















体 磁盘 中 的 某 个 文件 ， 这 号 




















程序 的 



































， 后 文中 直接 对 “类 ”的 





说 的 Class 文 件 指 的 是 一 串 二 进 


类 从 被 加 载 到 虚拟 机 内 存 中 开始 ， 到 逢 载 出 内 存 为 止 ， 它 的 整个 生命 周期 包括 了 : 加 载 (Loading) 、 验 证 (Verification) 、 准 备 (Preparation) 、 解 析 (Resolution) 、 初 始 化 (lInitialization) 、 








使 用 (Using) 和 御 载 (Unloading) 七 个 阶段 。 其 中 验证 、 准 备 和 解析 三 个 部 分 统称 为 连接 (Linking) 











验证 


Verificati on 


加 载 


Loading 


my 


wy 


年 p 载 | 
Urloadinge 


图 7-1 类 的 生命 周期 

















为 了 支持 Java 语 言 的 运行 时 绑 定 (也 称 为 动态 绑 定 或 晚期 绑 定 ) 。 请 注意 这 里 写 的 是 按部就班 地 “开始 ” ， 而 不 是 按部就班 地 “进行 ”或 “完成 ”， 








或 激活 另外 一 个 阶段 。 





会 在 一 个 阶段 执行 的 过 程 中 调 





什么 情况 下 需要 开始 类 加 载 过 程 的 第 一 个 阶段 : 加 载 。 虚 拟 机 规范 中 并 没有 进行 强制 约束 ， 这 点 可 以 交 给 虚拟 机 的 具体 实现 来 自由 把 握 。 但 是 对 于 初始 化 阶段 ， 虚 拟 机 规范 则 


(而 加 载 、 验 证 、 准 备 自然 需要 在 此 之 前 开始 ) : 





种 情况 必须 立即 对 类 进行 “初始 化 ” 


1) 遇 到 new、getstatic、putstatic 或 invokestatic 这 4 条 字 节 码 指令 时 ， 如 果 类 没有 进行 过 初始 化 ， 则 需要 先 触发 其 初始 化 。 生 成 这 4 条 指令 的 最 常见 的 Java 代 码 场景 是 : 使 有 


连接 ( Linking ) 

















时 候 、 读 取 或 设置 一 个 类 的 静态 字段 (被 final 修 饰 、 已 在 编译 期 把 结果 放 入 常量 池 的 静态 字段 除外 ) 的 时 候 ， 以 及 调 有 























的 时 候 ， 如 果 类 没有 进行 过 初始 化 ， 则 需要 先 触发 其 初始 化 。 





2) 使 





java.lang.reflect 包 的 方法 对 类 进行 发 射 调 











3) 当初 始 化 一 个 类 的 时 候 ， 如 果 发 现 其 父 类 还 没有 进行 过 初始 化 ， 则 需要 先 触发 其 父 类 的 初始 化 。 




















指定 一 个 要 执行 的 主 类 (包含 main() 方 法 的 那个 类 ) ， 





4) 当 虚 拟 机 启动 时 ， 





厂 前 























虚拟 机 规范 中 使 用 了 一 个 很 强烈 的 限定 语 : 
， 分 别 见 代码 清单 7-1、 代 码 清单 7-2 和 代码 清单 7-3。 








对 于 这 四 种 会 触发 类 进行 初始 化 的 场景 ， 
化 ， 称 为 被 动 引用 。 下 面 举 三 个 例子 来 说 明 被 动 引 



























































代码 清单 7-1 被 动 引 用 的 例子 之 一 


虚拟 机 会 先 初始 化 这 个 主 类 。 





， 这 七 个 阶段 的 发 生 顺 序 如 图 7-1 所 示 。 














准备 


Preparatlon 


Using 





一 个 类 的 静态 方法 的 时 候 。 











“有 且 只 有 ” ， 这 四 种 场景 中 的 行为 称 为 对 一 个 类 进行 





E 动 引 

















解析 


Resoluti on 





初始 化 


Initializatlion 


到 7-1 中 ， 加 载 、 验 证 、 准 备 、 初 始 化 和 和 镍 载 这 五 个 阶段 的 顺序 是 确定 的 ， 类 的 加 载 过 程 必须 按照 这 种 顺序 按部就班 地 开始 ， 而 解析 阶段 则 不 一 定 : 它 在 某 些 情况 下 可 以 在 初始 化 阶段 之 后 再 开始 ， 
因为 这 些 阶段 通常 都 是 互相 交叉 地 混合 式 进行 的 ， 通 常 





这 是 


是 严格 规定 了 有 上 且 只 有 














new 关 键 字 实例 化 对 象 的 























。 除 此 之 外 所 有 引 





类 的 方式 ， 都 不 会 触发 初始 





Package org.fenixsoft.classloading; 
/*w 


* 被 动 使 用 类 字段 演示 一 
* 通过 子 类 引用 父 类 的 静态 字段 ， 不 会 导致 子 类 初始 化 
让 
public class SuperClass { 
static { 
System.out .Println("SuperClass init!"); 
Public static int value = 123; 
} 
public class SubClass extends SuperClass { 
static { 
System.out .println ("SubClass init!"); 
} 
} 


大 大 


* 非 主动 使 用 类 字段 演示 
x#/ 


Public class NotInitialization { 
public static void main (String[] args) { 
System.out .Println(SubClass.value) 
} 





上 述 代 码 运行 之 后 ， 只 会 输出 “SuperClass init! ”， 而 不 会 输出 “SubClass init! “ 











。 对 于 静态 字段 ， 只 有 直接 定义 这 个 字段 的 类 才 会 被 初始 化 ， 




















此 通过 其 








子 类 来 引 














父 类 中 定义 的 静态 字段 ， 只 











会 触发 父 类 的 初始 化 而 不 会 触发 子 类 的 初始 化 。 至 于 是 否 要 触发 子 类 的 加 载 和 验证 ， 在 虚拟 机 规范 中 并 未 明确 规定 ， 这 点 取决 于 虚拟 机 的 具体 实现 。 对 于 Sun HotSpot 虚 拟 机 来 说 ， 可 通过 -XX: 


+TraceClassLoading 参 数 看 到 此 操作 会 导致 子 类 的 加 载 。 











代码 清单 7-2 被动 引 





的 例子 之 二 


package org.fenixsoft.classloading; 


* 被 动 使 用 类 字段 演示 二 : 

* 通过 数组 定义 来 引用 类 ， 不 会 触发 此 类 的 初始 化 
x*/ 

public class NotInitialization { 


public static void main (String[] args) { 
SuperClass[] sca = new SuperClass[10]; 

















这 段 代 码 为 了 节省 版 面 ， 了 代码 清单 7-1 中 的 SuperClass， 运 行 之 后 发 现 没 有 输出 “SuperClass init! 
面 触发 了 另外 一 个 名 为 “[Lorg.fenixsoft.classloading.SuperClass” 的 类 的 初始 化 阶段 ， 对 于 上 
子 类 ， 创 建 动作 由 字 节 码 指令 newarray 触 发 。 



































"， 说 明 并 没有 触发 类 org.fenixsoft.classloading.SuperClass 的 初始 化 阶段 。 但 是 这 段 代 码 里 
户 代码 来 说 ， 这 并 不 是 一 个 合法 














的 类 名 称 ， 它 是 一 个 由 虚拟 机 自动 








成 的 、 














直接 继承 于 java.lang.Object 的 

















这 个 类 代表 了 一 个 元 素 类 型 为 org.fenixsoft.classloading.SuperClass 的 一 维 数 组 ， 数 组 中 应 有 的 属性 和 方法 〈 


















































户 可 直接 使 








的 只 有 被 修饰 为 public 的 length 属 性 和 clone() 方 法 ) 都 实现 在 这 个 类 里 。 





Java 语 言 中 对 数组 的 访问 比 C/C+ + 相对 安全 ， 因 为 这 个 类 包装 了 数组 元 素 的 访问 方法 [0]， 而 C/C+ + 直接 翻译 为 对 数组 指针 的 移动 。 在 Java 语 言 中 ， 当 检查 到 发 生 数 组 越界 时 会 好 出 








java.lang.ArraylndexOutOfBoundsException 异 常 。 








代码 清单 7-3 ”被 动 引 








的 例子 之 三 





package org.fenixsoft.classloading; 


* 被 动 使 用 类 字段 演示 三 : 
* 常量 在 编译 阶段 会 存 入 调用 类 的 常量 池 中 ， 本 质 上 没有 直接 引用 到 定义 常量 的 类 ， 
的 初始 化 。 
| 
public class ConstClass { 
static { 
System.out .println("ConstClass init!"); 


因此 不 会 触发 定义 常量 的 类 


} 
public static final String HELLOWORLD = "hello world"; 
} 


/** 
A 


public class NotInitialization { 
public static void main (String[] args) { 
System.out .println (ConstClass .HELLOWORLD); 
} 











上 述 代码 运行 之 后 ， 也 没有 输出 “ConstClass init! ”， 这 是 因为 虽然 在 Java 源 码 中 引 
Notlnitialization 类 的 常量 池 中 ， 对 常量 ConstClass.HELLOWORLD 的 引 



















































































了 ConstClass 类 中 的 常量 HELLOWORLD， 但 是 在 编译 阶段 将 此 常量 的 值 “hello world” 存 储 到 了 
实际 都 被 转化 为 Notlnitialization 类 对 自身 常量 池 的 引用 了 。 也 就 是 说 实际 上 Notlnitialization 的 Class 文 件 之 中 并 没有 ConstClass 




















静态 语句 块 “static{}” 来 输出 初始 化 信息 的 ， 而 接口 中 不 能 







































































类 的 符号 引用 入 口 ， 这 两 个 类 在 编译 成 Class 之 后 就 不 存在 任何 联系 了 。 
接口 的 加 载 过 程 与 类 加 载 过 程 稍 有 一 些 不 同 ， 针 对 接口 需要 做 一 些 特殊 说 明 : 接口 也 有 初始 化 过 程 ， 这 点 与 类 是 一 致 的 ， 上 面 的 代码 都 是 
使 用 “static{}” 语 句 块 ， 但 编译 器 仍然 会 为 接口 生成 “<clinit>0” 类 构造 器 外 ， 用 于 初始 化 接口 中 所 定义 的 成 员 变 























。 接 








与 类 真正 有 所 区 别 的 是 前 面 讲述 的 四 种 “有 且 仅 有 ”需要 开始 初始 化 场景 中 的 第 



































三 种 : 当 一 个 类 在 初始 化 时 ， 要 求 其 父 类 全 部 都 已 经 初始 化 过 了 ， 但 是 一 个 接口 在 初始 化 时 ， 并 不 要 求 其 父 接 
始 化 。 














[] 准确 地 说 ， 越 界 检查 并 不 是 封装 在 数组 元 素 访 问 的 类 中 ， 而 是 封装 在 数组 访问 的 xaload、xastore 字 节 码 
思 ] 关于 类 构造 器 <clinit> 和 方法 构造 器 <init> 的 生成 过 程 和 作用 ， 可 参见 第 10 章 的 相关 内 容 。 


7.3 ”类 加 载 的 过 程 
接 下 来 我 们 详细 讲解 一 下 类 加 载 的 全 过 程 ， 也 就 是 加 载 、 验 证 、 准 备 、 解 析 和 初始 化 这 五 个 阶段 的 过 程 。 


73:1 加 载 


“加 载 ” (Loading) 阶段 是 “类 加 载 “ 
1) 通过 一 个 类 的 全 限定 名 来 获取 定义 此 类 的 二 进 制 字 节 流 。 


2) 将 这 个 字 节 流 所 代表 的 静态 存储 结构 转化 为 方法 区 的 运行 时 数据 结 





ss 





3) 在 Java 堆 中 生成 一 个 代表 这 个 类 的 java.lang.Class 对 象 ， 作 为 方法 区 这 些 数据 的 访问 入 口 。 























虚拟 机 规范 的 这 三 点 要 求实 际 上 并 不 具体 ， 





此 虚拟 机 实现 与 具体 应 

















全 部 都 完成 了 初始 化 ， 只 有 在 真正 使 


的 灵活 度 相当 大 。 例 如 “通过 一 个 类 的 全 限定 名 来 获取 定义 此 类 的 二 进 制 字 节 流 ” 

















到 父 接口 的 时 候 (如 引用 接口 中 定义 的 常量 ) 才 会 初 























(Class Loading) 过 程 的 一 个 阶段 ， 希 望 您 没有 混淆 这 两 个 看 起 来 很 相似 的 名 词 。 在 加 载 阶段 ， 虚 拟 机 需要 完成 以 下 三 件 事情 : 





， 并 没有 指明 二 进 制 字 节 流 要 从 一 个 Class 文 件 





中 获取 ， 准 确 地 说 是 根本 没有 指明 要 从 哪里 获取 及 怎样 获取 。 虚 拟 机 设计 团队 在 加 载 阶段 搭建 了 一 个 相当 开放 的 、 广 阔 的 舞台 ，Java 发 展 历程 中 ， 充 满 创造 力 的 开发 人 员 们 则 在 这 个 舞台 上 玩 出 了 各 种 花 











样 ， 许 多 举足轻重 的 Java 技 术 都 建立 在 这 一 基础 之 上 ， 例 如 : 





“ 从 ZIP 包 中 读 取 ， 这 很 常见 ， 最 终 成 为 日 后 JAR、EAR、WAR 格 式 的 基础 。 


. 从 网 络 中 获取 ， 这 种 场景 最 典型 的 应 用 就 是 Applet。 


' 运行 时 计算 生成 ， 这 种 场景 使 用 得 最 多 的 就 是 动态 代理 技术 ， 在 java.lang.reflect.Proxy 中 ， 就 是 用 了 ProxyGenerator.generateProxyClass 来 为 特定 接口 生成 *$Proxy 的 代理 类 的 二 进 制 字 节 流 。 


“ 由 其 他 文件 生成 ， 典 型 场景 : JSP 应 用 。 


“ 从 数据 库 中 读 取 ， 这 种 场景 相对 少见 些 ， 有 些 中 间 件 服务 器 (如 SAP Netweaver) 可 以 选择 把 程序 安装 到 数据 库 中 来 完成 程序 代码 在 集群 间 的 分 发 。 














相对 于 类 加 载 过 程 的 其 他 阶段 ， 加 载 阶段 (准确 地 说 ， 是 加 载 阶段 中 获取 类 的 二 进 制 字 节 流 的 动作 ) 是 开发 期 可 控 性 最 强 的 阶段 ， 因 为 加 载 阶段 既 可 以 使 用 系统 提供 的 类 加 载 器 来 完成 ， 也 可 以 由 用 户 
自 定义 的 类 加 载 器 去 完成 ， 开 发 人 员 们 可 以 通过 定义 自己 的 类 加 载 器 去 控制 字 节 流 的 获取 方式 。 关 于 类 加 载 器 的 话题 ， 本 章 将 在 7.4 节 专门 讲述 。 












































加 载 阶段 完成 后 ， 虚 拟 机 外 部 的 二 进 制 字 节 流 就 按照 虚拟 机 所 需 的 格式 存储 在 方法 区 之 中 ， 方 法 区 中 的 数据 存储 格式 由 虚拟 机 实现 自行 定义 ， 虚 拟 机 规范 未 规定 此 区 域 的 具体 数据 结构 。 然 后 在 Java 推 
中 实例 化 一 个 java.lang.Class 类 的 对 象 ， 这 个 对 象 将 作为 程序 访问 方法 区 中 的 这 些 类 型 数据 的 外 部 接口 。 加 载 阶段 与 连接 阶段 的 部 分 内 容 (如 一 部 分 字 节 码 文件 格式 验证 动作 ) 是 交叉 进行 的 ， 加 载 阶段 尚 
未 完成 ， 连 接 阶段 可 能 已 经 开始 ， 但 这 些 夹 在 加 载 阶段 之 中 进行 的 动作 ， 仍 然 属于 连接 阶段 的 内 容 ， 这 两 个 阶段 的 开始 时 间 仍然 保持 着 固定 的 先后 顺序 。 





















































7.3.2 ”验证 











验证 是 连接 阶段 的 第 一 步 ， 这 一 阶段 的 目的 是 为 了 确保 class 文件 的 字 节 流 中 包含 的 信息 符合 当前 虚拟 机 的 要 求 ， 并 且 不 会 危害 虚拟 机 自身 的 安全 。 























ava 语 言 本 身 是 相对 安全 的 语言 (依然 是 相对 于 C/C+ + 来 说 ) ， 使 用 纯粹 的 Java 代 码 无 法 做 到 诸如 访问 数组 边界 以 外 的 数据 、 将 一 个 对 象 转型 为 它 并 未 实现 的 类 型 、 跳 转 到 不 存在 的 代码 行 之 类 的 事 
情 ， 如 果 这 样 做 了 ， 编 译 器 将 拒绝 编译 。 但 前 面 已 经 说 过 ，(Class 文 件 并 不 一 定 要 求 用 Java 源 码 编译 而 来 ， 可 以 使 用 任何 途径 ， 包 括 用 十 六 进 制 编辑 器 直接 编写 来 产生 Class 文 件 。 在 字 节 码 的 语言 层面 上 ， 
上 述 Java 代 码 无 法 做 到 的 事情 都 是 可 以 实现 的 ， 至 少 语义 上 是 可 以 表达 出 来 的 。 虚 拟 机 如 果 不 检查 输入 的 字 节 流 ， 对 其 完全 信任 的 话 ， 很 可 能 会 因为 载 入 了 有 害 的 字 节 流 而 导致 系统 崩溃 ， 所 以 验证 是 虚拟 
机 对 自身 保护 的 一 项 重要 工作 。 





























































































































尽管 验证 阶段 是 非常 重要 的 ， 并 且 验 证 阶段 的 工作 量 在 虚拟 机 的 类 加 载 子 系统 中 占 了 很 大 一 部 分 ， 但 虚拟 机 规范 对 这 个 阶段 的 限制 和 指导 显得 非常 笼统 ， 仅 仅 疝 了 一 句 如 果 验 证 到 输入 的 字 节 流 不 符合 
Class 文 件 的 存储 格式 ， 就 抛 出 一 个 java.lang.VerifyError 异 常 或 其 子 类 异常 ， 具 体 应 当 检查 哪些 方面 ， 如 何 检查 ， 何 时 检查 ， 都 没有 强制 要 求 或 明确 说 明 ， 所 以 不 同 的 虚拟 机 对 类 验证 的 实现 可 能 会 有 所 不 
同 ， 但 大 致 上 都 会 完成 下 面 四 个 阶段 的 检验 过 程 : 文件 格式 验证 、 元 数据 验证 、 字 节 码 验证 和 符号 引用 验证 。 

































































1. 文 件 格式 验证 





第 一 阶段 要 验证 字 节 流 是 否 符合 Class 文 件 格式 的 规范 ， 并 且 能 被 当前 版 本 的 虚拟 机 处 理 。 这 一 阶段 可 能 包括 下 面 这 些 验 证 点 : 














“ 是 否 以 魔 数 0xCAFEBABE 开 头 。 

“ 主 、 次 版 本 号 是 否 在 当前 虚拟 机 处 理 范围 之 内 。 

“ 常量 池 的 常量 中 是 否 有 不 被 支持 的 常量 类 型 (检查 常量 tag 标 志 ) 。 

“ 指向 常量 的 各 种 索引 值 中 是 否 有 指向 不 存在 的 常量 或 不 符合 类 型 的 常量 。 
" CONSTANT_Utf8_info 型 的 常量 中 是 否 有 不 符合 UTF8 编 码 的 数据 。 


“ Class 文件 中 各 个 部 分 及 文件 本 身 是 否 有 被 删除 的 或 附加 的 其 他 信息 。 




















实际 上 第 一 阶段 的 验证 点 还 远 不 止 这 些 ， 上 面 这 些 只 是 从 Hotspot 虚 拟 机 源码 中 中 摘抄 的 一 小 部 分 ， 该 验证 阶段 的 主要 目的 是 保证 输入 的 字 节 流 能 正确 地 解析 并 存储 于 方法 区 之 内 ， 格 式 上 符合 描述 一 
个 Java 类 型 信息 的 要 求 。 这 阶段 的 验证 是 基于 字 节 流 进 行 的 ， 经 过 了 这 个 阶段 的 验证 之 后 ， 字 节 流 才 会 进入 内 存 的 方法 区 中 进行 存储 ， 所 以 后 面 的 三 个 验证 阶段 全 部 是 基于 方法 区 的 存储 结构 进行 的 。 












































2. 元 数据 验证 








第 二 阶段 是 对 字 节 码 描述 的 信息 进行 语义 分 析 ， 以 保证 其 描述 的 信息 符合 Java 语 言 规范 的 要 求 ， 这 个 阶段 可 能 包括 的 验证 点 如 下 : 





. 这 个 类 是 否 有 父 类 (除了 javalangObject 之 外 ， 所 有 的 类 都 应 当 有 父 类 ) 。 

. 这 个 类 的 父 类 是 否 继承 了 不 和 多 许 被 继承 的 类 (被 fnal 修 饰 的 类 ) 。 

“ 如果 这 个 类 不 是 抽象 类 ， 是 否 实现 了 其 父 类 或 接口 之 中 要 求实 现 的 所 有 方法 。 

. 类 中 的 字段 、 方 法 是 否 与 父 类 产生 了 矛盾 (例如 利益 了 父 类 的 final 字 段 ， 或 者 出 现 不 符合 规则 的 方法 重 载 ， 例 如 方法 参数 都 一 致 ， 但 返回 值 类 型 却 不 同等 ) 。 





第 二 阶段 的 主要 目的 是 对 类 的 元 数据 信息 进行 语义 校 验 ， 保 证 不 存在 不 符合 Java 语 言 规范 的 元 数据 信息 。 





3. 字 节 码 验证 














第 三 阶段 是 整个 验证 过 程 中 最 复杂 的 一 个 阶段 ， 主 要 工作 是 进行 数据 流 和 控制 流 分 析 。 在 第 二 阶段 对 元 数据 信息 中 的 数据 类 型 做 完 校 验 后 ， 这 阶段 将 对 类 的 方法 体 进行 校 验 分 析 。 这 阶段 的 任务 是 保证 
被 校 验 类 的 方法 在 运行 时 不 会 做 出 危害 虚拟 机 安全 的 行为 ， 例 如 : 


“ 保证 任意 时 刻 操作 数 栈 的 数据 类 型 与 指令 代码 序列 都 能 配合 工作 ， 例 如 不 会 出 现 类 似 这 样 的 情况 : 在 操作 栈 中 放置 了 一 个 int 类 型 的 数据 ， 使 用 时 却 按 long 类 型 来 加 载 入 本 地 变量 表 中 。 





“ 保证 跳 转 指令 不 会 跳 转 到 方法 体 以 外 的 字 节 码 指令 上 。 


“ 保证 方法 体 中 的 类 型 转换 是 有 效 的 ， 例 如 可 以 把 一 个 子 类 对 象 赋值 给 父 类 数据 类 型 ， 这 是 安全 的 ， 但 是 把 父 类 对 象 赋值 给 子 类 数据 类 型 ， 其 至 把 对 象 赋值 给 与 它 毫 无 继承 关系 、 完 全 不 相干 的 一 个 数 
据 类 型 ， 则 是 危险 和 不 合法 的 。 








点 。 这 里 涉及 了 离散 数学 中 一 个 很 著名 的 问题 “Halting Problem” 丫 : 通俗 一 点 的 说 法 就 是 ， 通 过 程序 去 校 验 程序 逻辑 是 无 法 做 到 绝对 准确 的 一 一 不 能 通过 程序 准确 地 检查 出 程序 是 否 能 在 有 限 的 时 间 之 
内 结束 运行 。 























由 于 数据 流 验证 的 高 复杂 性 ， 虚 拟 机 设计 团队 为 了 避免 将 过 多 的 时 间 消 耗 在 字 节 码 验证 阶段 ， 在 JDK 1.6 之 后 的 Javac 编 译 器 中 进行 了 一 项 优化 ， 给 方法 体 的 Code 属 性 的 属性 表 中 增加 了 一 项 名 














为 “stackMapTable” 的 属性 ， 这 项 属性 描述 了 方法 体 中 所 有 的 基本 块 (Basic Block， 按 照 控制 流 拆 分 的 代码 块 ) 开始 时 本 地 变量 表 和 操作 栈 应 有 的 状态 ， 这 可 以 将 字 节 码 验证 的 类 型 推导 转变 为 类 型 检查 
从 而 节省 一 些 时 间 。 当 然 ， 理 论 上 stackMapTable 属 性 也 存在 错误 或 被 纂 改 的 可 能 ， 所 以 是 否 有 可 能 在 恶意 纂 改 了 Code 属 性 的 同时 ， 也 生成 相应 的 StackMapTable 属 性 来 骗 过 虚拟 机 的 类 型 校 验 则 是 虚拟 
机 实现 时 值得 思考 的 问题 。 






































在 JDK 1.6 的 HotSpot 虚 拟 机 中 提供 了 -XX: -UseSplitVerifier 选 项 来 关闭 掉 这 项 优化 ， 或 者 使 用 参数 -XX: +FailOverToOldVerifier 要 求 在 类 型 校 验 失败 的 时 候 退 回 到 旧 的 类 型 推导 方式 进行 校 验 。 而 在 
JDK 1.7 之 后 ， 对 于 主 版 本 号 大 于 50 的 Class 文 件 ， 使 用 类 型 检查 来 完成 数据 流 分 析 校 验 则 是 唯一 的 选择 ， 不 允许 再 退回 到 类 型 推导 的 校 验 方式 。 















































4. 符 号 引用 验证 






























































最 后 一 个 阶段 的 校 验 发 生 在 虚拟 机 将 符号 引用 转化 为 直接 引用 的 时 候 ， 这 个 转化 动作 将 在 连接 的 第 三 个 阶段 一 一 解析 阶段 中 发 生 。 符 号 引用 验证 可 以 看 做 是 对 类 自身 以 外 (常量 池 中 的 各 种 符号 引用 
的 信息 进行 匹配 性 的 校 验 ， 通 常 需要 校 验 以 下 内 容 : 























“ 符号 引用 中 通过 字符 串 描述 的 全 限定 名 是 否 能 找到 对 应 的 类 。 
“ 在 指定 类 中 是 否 存在 符合 方法 的 字段 描述 符 及 简单 名 称 所 描述 的 方法 和 字段 。 
“ 符号 引用 中 的 类 、 字 段 和 方法 的 访问 性 (private、protected、public、default) 是 否 可 被 当前 类 访问 。 

















符号 引用 验证 的 目的 是 确保 解析 动作 能 正常 执行 ， 如 果 无 法 通过 符号 引用 验证 ， 将 会 抛 出 一 个 java.lang.IncompatibleClassChangeError 异 常 的 子 类 ,， 如 java.lang.lllegalAccessError、 
java.lang.NoSuchFieldError、java.lang.NoSuchMethodError 等 。 



































验证 阶段 对 于 虚拟 机 的 类 加 载 机 制 来 说 ， 是 一 个 非常 重要 的 、 但 不 一 定 是 必要 的 阶段 。 如 果 所 运行 的 全 部 代码 (包括 自己 写 的 、 第 三 方 包 中 的 代码 ) 都 已 经 被 反复 使 用 和 验证 过 ， 在 实施 阶段 就 可 以 考 
虑 使 用 -Xverify: none 参 数 来 关闭 大 部 分 的 类 验证 措施 ， 以 缩短 虚拟 机 类 加 载 的 时 间 。 


























7.3.3 ”准备 


准备 阶段 是 正式 为 类 变量 分 配 内 存 并 设置 类 变量 初始 值 的 阶段 ， 这 些 内 存 都 将 在 方法 区 中 进行 分 配 。 这 个 阶段 中 有 两 个 容易 产生 混淆 的 概念 需要 强调 一 下 ， 首 先是 这 时 候 进行 内 存 分 配 的 仅 包括 类 变量 
(被 static 修 饰 的 变量 ) ， 而 不 包括 实例 变量 ， 实 例 变 量 将 会 在 对 象 实例 化 时 随 着 对 象 一 起 分 配 在 Java 堆 中 。 其 次 是 这 里 所 说 的 初始 值 “通常 情况 ”下 是 数据 类 型 的 零 值 ， 假 设 一 个 类 变量 的 定义 为 : 




















public static int value = 123; 











那么 变量 value 在 准备 阶段 过 后 的 初始 值 为 0 而 不 是 123， 因 为 这 时 候 尚未 开始 执行 任何 java 方法， 而 把 value 赋 值 为 123 的 putstatic 指 令 是 程序 被 编译 后 ， 存 放 于 类 构造 器 <clinit> () 方 法 之 中 ， 所 以 把 
value 赋 值 为 123 的 动作 将 在 初始 化 阶段 才 会 被 执行 。 表 7-1 列 出 了 Java 中 所 有 基本 数据 类 型 的 零 值 。 




















上 面 提 到 ， 在 “通常 情况 ”下 初始 值 是 零 值 ， 那 相对 的 会 有 一 些 “ 特 殊 情 况 ” : 如 果 类 字段 的 字段 属性 表 中 存在 ConstantValue 属 性 ， 那 在 准备 阶段 变量 value 就 会 被 初始 化 为 ConstantValue 属 性 所 指 
定 的 值 ， 假 设 上 面 类 变量 value 的 定义 变 为 : 











public static final int value = 123; 





编译 时 Javac 将 会 为 value 生 成 ConstantValue 属 性 ， 在 准备 阶段 虚拟 机 就 会 根据 ConstantValue 的 设置 将 value 赋 值 为 123。 





表 7-1 基本 数据 类 型 的 零 值 








数据 类 型 零 值 
int 0 

long 0L 

short (short) 0 
char ‘\u0000’ 
byte (byte) 0 
boolean false 
float 0.0f 
double 0.0d 
reference null 


7.3.4 解析 


















































解析 阶段 是 虚拟 机 将 常量 池内 的 符号 引用 蔡 换 为 直接 引用 的 过 程 ， 符 号 引用 在 前 一 章 讲解 Class 文 件 格式 的 时 候 就 已 经 出 现 过 多 次 ， 在 Class 文 件 中 它 以 CONSTANT_ Class info、 
CONSTANT Fieldref info、CONSTANT_Methodref info 等 类 型 的 常量 出 现 ， 那 解析 阶段 中 所 说 的 直接 引用 与 符号 引用 又 有 什么 关联 呢 ? 












































: 符号 引用 (Symbolic References) : 符号 引用 以 一 组 符号 来 描述 所 引用 的 目标 ， 符 号 可 以 是 任何 形式 的 字面 量 ， 只 要 使 用 时 能 无 歧义 地 定位 到 目标 即 可 。 符 号 引用 与 虚拟 机 实现 的 内 存 布局 无 关 ， 引 用 
的 目标 并 不 一 定 已 经 加 载 到 内 存 中 。 

“ 直接 引用 (Direct References) : 直接 引用 可 以 是 直接 指向 目标 的 指针 、 相 对 偏 移 量 或 是 一 个 能 间接 定位 到 目标 的 句柄 。 直 接 引 用 是 与 虚拟 机 实现 的 内 存 布局 相关 的 ， 同 一 个 符号 引用 在 不 同 虚 拟 机 实 
例 上 翻译 出 来 的 直接 引用 一 般 不 会 相同 。 如 果 有 了 直接 引用 ， 那 引用 的 目标 必定 已 经 在 内 存 中 存在 。 





虚拟 机 规范 之 中 并 未 规定 解析 阶段 发 生 的 具体 时 间 ， 只 要 求 了 在 执行 anewarray、checkcast、getfield、getstatic、instanceof、invokeinterface、invokespecial、invokestatic、invokevirtual、 


multianewarray、new、putfield 和 putstatic 这 13 个 用 于 操作 符号 引用 的 字 节 码 指令 之 前 ， 先 对 它们 所 使 用 的 符号 引用 进行 解析 。 所 以 虚拟 机 实现 会 根据 需要 来 判断 ， 到 底 是 在 类 被 加 载 器 加 载 时 就 对 常量 







































































































































































池 中 的 符号 引用 进行 解析 ， 还 是 等 到 一 个 符号 引用 将 要 被 使 用 前 才 去 解析 它 。 

对 同一 个 符号 引用 进行 多 次 解析 请 求 是 很 常见 的 事情 ， 虚 拟 机 实现 可 能 会 对 第 一 次 解析 的 结果 进行 缓存 〈 在 运行 时 常量 池 中 记录 直接 引用 ， 并 把 常量 标识 为 已 解析 状态 ) 从 而 避免 解析 动作 重复 进行 。 
无 论 是 否 真 正 执行 了 多 次 解析 动作 ， 虚 拟 机 需要 保证 的 都 是 在 同一 个 实体 中 ， 如 果 一 个 符号 引用 之 前 已 经 被 成 功 解析 过 ， 那 么 后 续 的 引用 解析 请 求 就 应 当 一 直 成 功 ; 同样 地 ， 如 果 第 一 次 解析 失败 了 ， 其 他 
指令 对 这 个 符号 的 解析 请 求 也 应 该 收 到 相同 的 异常 。 
































进行 ， 分 别 对 应 于 常量 池 的 CONSTANT_Class_ info、CONSTANT _ Fieldref info、CONSTANT_Methodref info 及 












































解析 动作 主要 针对 类 或 接口 、 字 段 、 类 方法 、 接 口 方法 四 类 符号 引 
CONSTANT InterfaceMethodref_ info 四 种 常量 类 型 B]。 下 面 将 讲解 这 四 种 引用 的 解析 过 程 。 
1. 类 或 接口 的 解析 




















假设 当前 代码 所 处 的 类 为 D， 如 果 要 把 一 个 从 未 解析 过 的 符号 引用 N 解 析 为 一 个 类 或 接 


C 的 直接 引 








， 那 虚拟 机 完成 整个 解析 的 过 程 需要 包括 以 下 3 个 步 


























1) 如 果 C 不 是 一 个 数组 类 型 ， 那 虚拟 机 将 会 把 代表 N 的 全 限定 名 传递 给 D 的 类 加 载 器 去 力 
加 载 这 个 类 的 父 类 或 实现 的 接口 。 

















2) 如 果 C 是 一 个 数组 类 型 ， 并 
， 需 要 加 载 的 元 素 类 型 就 是 “java.lang.Integer”， 接 着 





























3) 如 果 上 面 的 步骤 没有 出 现任 何 异 常 ， 那 么 C 在 虚拟 机 
将 抛 出 java.lang.lllegalAccessError 异 常 。 





限 ， 


2. 字 段 解析 











， 首 先 将 会 对 字段 表 内 class_index 内 项 中 索引 的 C 





解析 一 个 未 被 解析 过 的 字段 符号 引 




















[ 工 这 个 类 C。 在 加 载 过 程 中 ， 由 了 
一 旦 这 个 加 载 过 程 出 现 了 任何 异常 ， 解 析 过 程 就 将 宣告 失败 。 


数组 的 元 素 类 型 为 对 象 ， 也 就 是 N 的 描述 符 会 是 类 似 “[Ljava. 
虚拟 机 生成 一 个 代表 此 数组 维度 和 元 素 的 数组 对 象 。 


中 实际 上 已 经 成 为 一 个 有 效 的 类 或 接 





F 无 数据 验证 、 字 节 码 验证 的 需要 ， 又 将 可 能 触发 其 他 相关 类 的 加 载 动 作 ， 例 如 





段 设 的 形 





ang.Integer” 的 形式 ， 那 将 会 按照 第 1 点 的 规则 加 载 数组 元 素 类 型 。 如 果 N 的 描述 符 如 前 面 所 人 





























备 对 D 的 访问 权限 。 如 果 发 现 不 具备 访问 权 























了 ， 但 在 解析 完成 之 前 还 要 进行 符号 引用 验证 ,确认 C 是 否 
































。 如 果 在 解析 这 个 类 或 接 











的 符号 引 











属 的 类 或 接 








进行 解析 ， 也 就 是 字段 所 





ONSTANT _ Class info 符 号 引 















































































































































































































































符号 引用 的 过 程 中 出 现 了 任何 异常 ， 都 会 导致 字段 符号 引用 解析 的 失败 。 如 果 解 析 成 功 完成 ， 那 将 这 个 字段 所 属 的 类 或 接口 用 C 表 示 ， 虚 拟 机 规范 要 求 按照 如 下 步骤 对 C 进 行 后 续 字 段 的 搜索 : 

1) 如 果 C 本 身 就 包含 了 简单 名 称 和 字段 描述 符 都 与 目标 相 匹 配 的 字段 ， 则 返回 这 个 字段 的 直接 引用 ， 查 找 结束 。 

2) 否则 ， 如 果 在 C 中 实现 了 接口 ， 将 会 按照 继承 关系 从 上 往 下 递归 搜索 各 个 接口 和 它 的 父 接口 ， 如 果 接 口中 包含 了 简单 名 称 和 字段 描述 符 都 与 目标 相 匹 配 的 字段 ， 则 返回 这 个 字段 的 直接 引用 ， 查 找 结 
束 。 

3) 否则 ， 如 果 C 不 是 java.lang.Object 的 话 ， 将 会 按照 继承 关系 从 上 往 下 递归 搜索 其 父 类 ， 如 果 在 父 类 中 包含 了 简单 名 称 和 字段 描述 符 都 与 目标 相 匹 配 的 字段 ， 则 返回 这 个 字段 的 直接 引用 ， 查 找 结 





4) 否则 ， 查 找 失败 ， 抛 出 java.lang.NoSuchFieldError 异 常 。 











如 果 查 找 过 程 成 功 返 回 了 引 











， 将 会 对 这 个 字段 进行 权限 验证 ， 如 果 发 现 不 具备 对 字段 的 访问 权限 ， 将 抛 出 ava.lang. 















































llegalAccessError 异 常 。 














Eb 
Bez 








比 上 述 规范 要 求 得 更 加 严格 一 些 ， 





在 实际 应 用 中 ， 虚 拟 机 的 编译 器 实现 可 





如 果 有 一 个 同名 字段 同时 出 现在 C 的 接口 


自己 或 父 类 的 多 个 接口 中 出 现 ， 那 编译 器 将 可 能 拒绝 编 





和 父 类 中 ， 或 者 同时 在 

















， 接 





。 在 代码 清单 7-4 中 ， 如 果 注 释 了 Sub 类 中 的 “public static int A=4; “ 





代码 清单 7-4 ”字段 解析 





与 父 类 同时 存在 字段 A， 那 编译 器 将 提示 “The field Sub.A is ambiguous”， 并 且 会 拒绝 编译 这 段 代码 。 





Package org.fenixsoft.classloading; 
Public class FieldResolution { 
interface Interface0 { 
int A= 0; 
上 
interface Interfacel extends Interface0 { 
int A= 1; 
. 
interface Interface2 
int A= 2; 


{ 
‘ 


static class Parent implements Interfacel { 
public static int A= 3; 

1 

static class Sub extends Parent implements Interface2 { 
public static int A= 4; 

i 

public static void main (String[] args) { 

System.out .Println(Sub.RA) 7 


3. 类 方法 解析 


类 方法 解析 的 第 一 个 步骤 与 字段 解析 一 样 ， 也 是 需要 先 解析 出 类 方法 表 的 class_ indexD] 项 中 索引 的 方法 所 





如 下 步骤 进行 后 续 的 类 方法 搜索 : 








引 























1) 类 方法 和 接口 方法 符 














2) 如 果 通过 了 第 (1) 步 ， 在 类 C 中 查找 是 否 有 简单 名 称 和 描述 符 都 与 





























3) 否则 ， 在 类 C 的 父 类 中 递归 查找 是 否 有 简单 名 称 和 描述 符 都 与 


的 常量 类 型 定义 是 分 开 的 ， 如 果 在 类 方法 表 中 发 现 class index 中 索引 的 C 是 个 接 
标 相 匹 配 的 方法 ， 如 果 有 则 返 


标 相 匹 配 的 方法 ， 如 果 有 风 











表示 这 个 类 ， 接 下 来 虚拟 机 将 会 按照 

















属 的 类 或 接口 的 符号 引用 ， 如 果 解 析 成 功 ， 我 们 依然 





























那 就 直接 抛 出 java.lang.IncompatibleClassChangeError 异 常 。 


FF 


口 ， 




















这 个 方法 的 直接 引用 ， 查 找 结束 。 











回 
































这 个 方法 的 直接 引 





， 查 找 结束 。 








返 





日 



































4) 否则 ， 在 类 C 实 现 的 接口 列表 及 它们 的 父 接 
java.lang.AbstractMethodError 异 常 。 

















5) 和 否则， 宣告 方 法 查找 失败 ， 抛 出 java.lang.NoSuchMethodError。 


之 中 递归 查找 是 否 有 简单 名 称 和 描述 符 都 与 








标 相 匹 配 的 方法 ， 如 果 存 在 匹配 的 方法 ， 说 明 类 C 是 一 个 抽象 类 ， 这 时 候 查 找 结束 ， 抛 出 












































接 引 用 ， 将 会 对 这 个 方法 进行 权限 验证 ;如果 发 现 不 





最 后 ， 如 果 查 找 过 程 成 功 返 回 了 直 








4. 接 口 方法 解析 











备 对 此 方法 的 访问 权限 ， 将 抛 出 ava.lang.lllegalAccessError 异 常 。 





























接口 方法 也 是 需要 先 解析 出 接口 方法 表 的 class_ index[g 项 中 索引 的 方法 所 属 的 类 或 接口 的 符号 引用 ， 如 果 解 析 成 功 ， 依 然 用 C 表 示 这 个 接口 ， 接 下 来 虚拟 机 将 会 按照 如 下 步骤 进行 后 续 的 接 



































1) 与 类 方法 解析 相反 ， 如 果 在 接口 方法 表 中 发 现 class_ index 中 的 索引 C 是 个 类 而 不 是 接口 ， 那 就 直接 抛 出 java.lang.IncompatibleClassChangeError 异 常 。 




































































2) 否则 ， 在 接口 C 中 查找 是 否 有 简单 名 称 和 描述 符 都 与 目标 相 匹 配 的 方法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 查 找 结束 。 














口 方法 搜 




















3) 否则 ， 在 接口 C 的 父 接口 中 递归 查找 ， 直 到 java.lang.Object 类 (查找 范围 会 包括 Object 类 ) 为 止 ， 看 是 否 有 简单 名 称 和 描述 符 都 与 目标 相 匹配 的 方法 ， 如 果 有 则 返回 这 个 方法 的 直接 引 












































， 查 找 结 






































4) 否则 ， 宣 告 方法 查找 失败 ， 抛 出 java.lang.NoSuchMethodError 异 常 。 


由 于 接口 中 的 所 有 方法 都 默认 是 public 的 ， 所 以 不 存在 访问 权限 的 问题 ， 因 此 接口 方法 的 符号 解析 应 当 不 会 抛 出 java.lang.lllegalAccessError 异 常 。 











7.3.5 初始 化 











类 初始 化 阶段 是 类 加 载 过 程 的 最 后 一 步 ， 前 面 的 类 加 载 过 程 中 ， 除 了 在 加 载 阶段 用 户 应 用 程序 可 以 通过 自 定义 类 加 载 器 参与 之 外 ， 其 余 动作 完全 由 虚拟 机 主导 和 控制 。 到 了 初始 化 阶段 ， 才 真正 开始 执 


























行 类 中 定义 的 Java 程 序 代码 (或 者 说 是 字 节 码 ) 。 








在 准备 阶段 ， 变 量 已 经 赋 过 一 次 系统 要 求 的 初始 值 ， 而 在 初始 化 阶段 ， 则 是 根据 程序 员 通 过 程序 制定 的 主观 计划 去 初始 化 类 变量 和 其 他 资源 ， 或 者 可 以 从 另外 一 个 角度 来 表达 : 初始 化 阶段 是 执行 类 构 
造 器 <clinit> () 方 法 的 过 程 。 我 们 放 到 后 面 再 讲 <clinit> () 方 法 是 怎么 生成 的 ， 在 这 里 ， 我 们 先 看 一 下 <clinit> () 方 法 执行 过 程 中 可 能 会 影响 程序 运行 行为 的 一 些 特 点 和 细节 ， 这 部 分 相对 更 贴近 于 普通 的 程序 

















开发 人 员 []: 


:<clinit>0 方 法 是 由 编译 器 自动 收集 类 中 的 所 有 类 变量 的 典 值 动作 和 静态 语 白 块 (static{} 块 ) 中 的 语句 合并 产生 的 ， 编 译 器 收集 的 顺序 是 由 语句 在 源 文件 中 出 现 的 顺序 所 决定 的 ， 静 态 语句 
问 到 定义 在 静态 语句 块 之 前 的 变量 ， 定 义 在 它 之 后 的 变量 ， 在 前 面 的 静态 语句 块 中 可 以 赋值 ， 但 是 不 能 访问 。 


块 中 只 能 访 


“<clinit>0 方 法 与 类 的 构造 函数 (或 者 说 实例 构造 器 <clinit>0 方 法 ) 不 同 ， 它 不 需要 显 式 地 调用 父 类 构造 器 ， 虚 拟 机 会 保证 在 子 类 的 <clinit>0 方 法 执行 之 前 ， 父 类 的 <clinit>0 方 法 已 经 执行 完毕 。 因 此 


在 虚拟 机 中 第 一 个 被 执行 的 <clinit>0 方 法 的 类 肯定 是 java.lang.Object。 
“ 由 于 父 类 的 <clinit>0 方 法 先 执行 ， 也 就 意味 着 父 类 中 定义 的 静态 语句 块 要 优先 于 子 类 的 变量 赋值 操作 ， 如 代码 清单 7-5 中 ， 字 段 B 的 值 将 会 是 2 而 不 是 1。 


代码 清单 7-5 ”<clinit> (方法 执行 顺序 


static class Parent { 
public static int A= 1; 
static { 
A=2; 
} 


static class Sub extends Parent { 
public static int B= A; 

} 

public static void main (String[] args) { 
System.out.println (Sub.B); 

} 





“ <clinit>0 方 法 对 于 类 或 接口 来 说 并 不 是 必须 的 ， 如 果 一 个 类 中 没有 静态 语句 块 ， 也 没有 对 变量 的 赋值 操作 ， 那 么 编译 器 可 以 不 为 这 个 类 生成 <clinit>0 方 法 。 


“ 接口 中 不 能 使 用 静态 语句 块 ， 但 仍然 有 变量 初始 化 的 赋值 操作 ， 因 此 接口 与 类 一 样 都 会 生成 <clinit>0 方 法 。 但 接口 与 类 不 同 的 是 ， 执 行 接口 的 <clinit>0 方 法 不 需要 先 执 行 父 接口 的 <clinit>0 方 法 。 只 


有 当 父 接口 中 定义 的 变量 被 使 用 时 ， 父 接口 才 会 被 初始 化 。 另 外 ， 接 口 的 实现 类 在 初始 化 时 也 一 样 不 会 执行 接口 的 <clinit>0 方 法 。 


“ 康 拟 机 会 保证 一 个 类 的 <clinit>0 方 法 在 多 线程 环境 中 被 正确 地 加 锁 和 同步 ， 如果 多 个 线程 同时 去 初始 化 一 个 类 ， 那 么 只 会 有 一 个 线程 去 执行 这 个 类 的 <clinit>0 方 法 ， 其 他 线程 都 需要 阻塞 等 待 ， 直 到 


活动 线程 执行 <clinit>0 方 法 完毕 。 如 果 在 一 个 类 的 <clinit>0 方 法 中 有 耗 时 很 长 的 操作 ， 那 就 可 能 造成 多 个 进程 阻塞 ， 在 实际 应 用 中 这 种 阻塞 往往 是 很 隐藏 的 。 代 码 清 单 7-6 演 示 了 这 种 场景 。 


代码 清单 7-6 “字段 解析 





static class DeadLoopClass { 
static 
// 如 果 不 加 上 这 个 if 语句 ， 编 译 器 将 提示 "ITnitializer does not complete normally" 并 拒绝 编译 
if (true) { 
System.out .println (Thread.currentThread() + "init DeadLoopClass"); 
while (true) { 


E 





} 
} 
public static void main(String[] args) { 
Runnable script = new Runnable() { 
public void run() { 
System.out .println (Thread.currentThread() + "start"); 
DeadLoopClass dlc = new DeadLoopClass () 7 
System.out .Println (Thread.currentThread() + " run over"); 


} 


Thread threadl = new Thread (script); 
Thread thread2 = new Thread (script); 
threadl .start (); 
thread2.start (); 





运行 结果 如 下 ， 一 条 线程 正在 死 循 环 以 模拟 长 时 间 操作 ， 另 外 一 条 线程 在 阻塞 等 待 : 





Thread[Thread-0,5,main]start 
Thread[Thread-1,5,main]start 
Thread[Thread-0,5,main]init DeadLoopClass 


四] 源码 位 置 : hotspot\src\share\vm\classfile\classFileParser.cpp。 


四 停机 问题 就 是 判断 任意 一 个 程序 是 否 会 在 有 限 的 时 间 之 内 结束 运行 的 问题 。 如 果 这 个 问题 可 以 在 有 限 的 时 间 之 内 解决 ， 则 可 以 有 一 个 程序 判断 其 本 身 是 否 会 停机 并 做 出 相反 的 行为 。 这 时 候 显 


问题 的 结果 是 什么 都 不 会 符合 要 求 。 所 以 这 是 一 个 不 可 解 的 问题 。 具 体 的 证 明 过 程 可 参考 : http://zh.wikipedia.org/zh/ 停机 问题 。 
D 严格 来 说 ，CONSTANT _String info 和 CONSTANT _InterfaceMethodref info 这 两 种 类 型 的 常量 也 有 解析 过 程 。 

团 参见 第 6 章 中 关于 CONSTANT Fieldref info 常量 的 相关 内 容 。 

[5] 参见 第 6 章 关 于 CONSTANT_Methodref info 常 量 的 相关 内 容 。 


然 不 管 停机 


[6] 参见 第 6 章 关 于 CONSTANT _IntetrfaceMethodref info 常 量 的 相关 内 容 。 


四 ] 这 里 只 限于 Java 语 言 编 译 产生 的 class 文 件 ， 并 不 包括 其 他 JVM 语 言 。 


7.4 类 加 载 器 








虚拟 机 设计 团队 把 类 加 载 阶 段 中 的 “通过 一 个 类 的 全 限定 名 来 获取 描述 此 类 的 二 进 制 字 节 流 ” 这 个 动作 放 到 Java 虚 拟 机 外 部 去 实现 ， 以 便 让 应 用 程序 自己 决定 如 何 去 获 取 所 需要 的 类 。 实 现 这 个 动作 的 
代码 模块 被 称 为 “类 加 载 器 ”。 












































类 加 载 器 可 以 说 是 Java 语 言 的 一 项 创新 ， 也 是 Java 语 言 流行 的 重要 原因 之 一 ， 它 最 初 是 为 了 满足 Java Applet 的 需求 而 被 开发 出 来 的 。 如 今 Java Applet 技 术 基本 上 已 经 死 掉 [1]， 但 类 加 载 器 却 在 类 层次 
划分 、0SGi、 热 部 署 、 代 码 加 密 等 领域 大 放 异彩 ， 成 为 了 Java 技 术 体系 中 一 块 重要 的 基石 ， 真 可 谓 是 失 之 桑 榆 ， 收 之 东 隅 。 























7.4.1 ”类 与 类 加 载 器 























类 加 载 器 虽然 只 用 于 实现 类 的 加 载 动 作 ， 但 它 在 Java 程 序 中 起 到 的 作用 却 远 远 不 限于 类 加 载 阶段 。 对 于 任意 一 个 类 ， 都 需要 由 加 载 它 的 类 加 载 器 和 这 个 类 本 身 一 同 确立 其 在 Java 虚 拟 机 中 的 唯一 性 。 这 
句 话 可 以 表达 得 更 通俗 一 些 : 比较 两 个 类 是 否 “ 相 等 ”， 只 有 在 这 两 个 类 是 由 同一 个 类 加 载 器 加 载 的 前 提 之 下 才 有 意义 ， 否 则 ， 即 使 这 两 个 类 是 来 源 于 同一 个 Class 文 件 ， 只 要 加 载 它们 的 类 加 载 器 不 同 ， 那 
这 两 个 类 就 必定 不 相等 。 



































这 里 所 指 的 “相等 ”， 包 括 代表 类 的 Class 对 象 的 equals() 方 法 、isAssignableFrom() 方 法 、islnstance() 方 法 的 返回 结果 ， 也 包括 了 使 用 instanceof 关 键 字 做 对 象 所 属 关系 判定 等 情况 。 如 果 没 有 注意 到 
类 加 载 器 的 影响 ， 在 某 些 情况 下 可 能 会 产生 具有 迷惑 性 的 结果 ， 代 码 清单 7-7 中 演示 了 不 同 的 类 加 载 器 对 instanceof 关 键 字 运算 结果 的 影响 。 






































代码 清单 7-7 不 同 的 类 加 载 器 对 instanceof 关 键 字 运算 结果 的 影响 





大 大 


* 类 加 载 器 与 instanceof 关 键 字 演示 
x 


* @author zzm 
SR 
public class ClassLoaderTest { 
public static void main (String[] args) throws Exception { 
ClassLoader myLoader = new ClassLoader() { 


Override 
public Class<?> loadClass (String name) throws ClassNotFoundException { 

try { 
String fileName = name.substring (name.lastIndexOf(".") + 1) + 


"Class"y 
InPutStream is = getClass () .getResourceAsStream (fileName); 
if (is == null) { 
return super.loadClass (name); 
} 
byte[] b = new byte[is.available()]7 
is.read (b) 7 
return defineClass (name, b, 0, b.length); 
} catch (IOException e) { 
throw new ClassNotFoundException (name); 
} 
} 


] 7 
Object obj = myLoader.1loadClass ("org.fenixsoft.classloading. 
ClassLoaderTest") .newInstance () 7 
System.out .Println(obj.getClass () ) 7 
System.out .Println (obj instanceof org.fenixsoft.classloading. 
ClassLoaderTest); 
} 








class org.fenixsoft.classloading.ClassLoaderTest 
false 























代码 清单 7-7 中 构造 了 一 个 简单 的 类 加 载 器 ， 尽 管 很 简陋 ， 但 是 对 于 这 个 演示 来 说 还 是 够 用 了 。 它 可 以 加 载 与 自己 在 同一 路 径 下 的 Class 文 件 。 我 们 使 用 这 个 类 加 载 器 去 加 载 了 一 个 名 
为 “org.fenixsoft.classloading.ClassLoaderTest” 的 类 ， 并 实例 化 了 这 个 类 的 对 象 。 两 行 输出 结果 中 ， 从 第 一 句 可 以 看 到 这 个 对 象 确实 是 类 org.fenixsoft.classloading.ClassLoaderTest 实 例 化 出 来 的 对 
象 ， 但 从 第 二 句 可 以 发 现 这 个 对 象 与 类 org.fenixsoft.classloading.ClassLoaderTest 做 所 属 类 型 检查 的 时 候 却 返回 了 false， 这 是 因为 虚拟 机 中 存在 了 两 个 ClassLoaderTest 类 ， 一 个 是 由 系统 应 用 程序 类 加 载 
器 加 载 的 ， 另 外 一 个 是 由 我 们 自 定义 的 类 加 载 器 加 载 的 ， 虽 然 都 来 自 同一 个 Class 文 件 ， 但 依然 是 两 个 独立 的 类 ， 做 对 象 所 属 类 型 检查 时 结果 自然 为 false。 




























































































7.4.2 ”双亲 委派 模型 

















他 的 类 





站 在 Java 虚 拟 机 的 角度 讲 ， 只 存在 两 种 不 同 的 类 加 载 器 : 一 种 是 启动 类 加 载 器 (Bootstrap ClassLoader) ， 这 个 类 加 载 器 使 用 C++ 语 言 实现 外 ， 是 虚拟 机 自身 的 一 部 分 ;另外 一 种 就 是 所 有 
加 载 器 ， 这 些 类 加 载 器 都 由 Java 语 言 实现 ， 独 立 于 虚拟 机 外 部 ， 并 且 全 都 继承 自 抽象 类 java.lang.ClassLoader。 





























从 Java 开 发 人 员 的 角度 来 看 ， 类 加 载 器 就 还 可 以 划分 得 更 细致 一 些 ， 绝 大 部 分 Java 程 序 都 会 使 用 到 以 下 三 种 系统 提供 的 类 加 载 器 : 





: 启动 类 加 载 器 (Bootsttap ClassLoader) : 前 面 已 经 介绍 过 ， 这 个 类 加 载 器 负责 将 存放 在 <JAVA_HOME>\lib 目 录 中 的 ， 或 者 被 -Xbootclasspath 参 数 所 指定 的 路 径 中 的 ， 并 且 是 虚拟 机 识别 的 ( 仅 按照 文 
件 名 识别 ， 如 rt.jar， 名 字 不 符合 的 类 库 即 使 放 在 lib 目 录 中 也 不 会 被 加 载 ) 类 库 加 载 到 虚拟 机 内 存 中 。 启 动 类 加 载 器 无 法 被 Java 程 序 直接 引用 。 


“ 扩展 类 加 载 器 (Extension ClassLoader) : 这 个 加 载 器 由 sun.misc.Launcher$ExtClassLoader 实 现 ， 它 负责 加 载 <JAVA_HOME>\lib\ext 目 录 中 的 ， 或 者 被 javaext.dirs 系 统 变 量 所 指定 的 路 径 中 的 所 有 类 库 ， 
开发 者 可 以 直接 使 用 扩展 类 加 载 器 。 


“ 应 用 程序 类 加 载 器 (Application ClassLoader) : 这 个 类 加 载 器 由 sun.misc.Launcher$AppClassLoader 来 实现 。 由 于 这 个 类 加 载 器 是 ClassLoader 中 的 getSystemClassLoader() 方 法 的 返回 值 ， 所 以 一 般 也 称 它 为 系 
统 类 加 载 器 。 它 负责 加 载 用 户 类 路 径 (ClassPath) 上 所 指定 的 类 库 ， 开 发 者 可 以 直接 使 用 这 个 类 加 载 器 ， 如 果 应 用 程序 中 没有 自 定义 过 自己 的 类 加 载 器 ， 一 般 情 况 下 这 个 就 是 程序 中 默认 的 类 加 载 器 。 

















我 们 的 应 用 程序 都 是 由 这 三 种 类 加 载 器 互相 配合 进行 加 载 的 ， 如 果 有 必要 ， 还 可 以 加 入 自己 定义 的 类 加 载 器 。 这 些 类 加 载 器 之 间 的 关系 一 般 会 如 图 7-2 所 示 。 

















司 动 关 加 载 器 


Bootstrap ClassLoader 


扩展 类 加 载 絮 


Extension ClassLoader 


应 用 程序 关 加 载 器 


Application ClassLoader 


目 定 尺 尖 加 载 器 目 年 尺 类 加 载 器 


User ClassLoader 


User ClassLoader 





图 7-2 ”类 加 载 器 双亲 委派 模型 








图 7-2 中 所 展示 的 类 加 载 器 之 间 的 这 种 层次 关系 ， 就 称 为 类 加 载 器 的 双亲 委派 模型 (Parents Delegation Model) 。 双 亲 委 派 模 型 要 求 除 了 顶 
类 加 载 器 。 这 里 类 加 载 器 之 间 的 父子 关系 一 般 不 会 以 继承 (Inheritance) 的 关系 来 实现 ， 而 是 都 使 








层 的 启动 类 加 载 器 外 ， 其 余 的 类 加 载 器 都 应 当 有 自己 的 父 
组 合 (Composition) 关系 来 复 用 父 加 载 器 的 代码 。 

















类 加 载 器 的 双亲 委派 模型 在 JDK 1.2 期 间 被 引入 并 被 广泛 应 用 于 之 后 几乎 所 有 的 Java 程 序 中 ， 但 它 并 不 是 一 个 强制 性 的 约束 模型 ， 而 是 Java 设 计 者 们 推荐 给 开发 者 们 的 一 种 类 加 载 器 实现 方式 。 








双亲 委派 模型 的 工作 过 程 是 : 如 果 一 个 类 加 载 器 收 到 了 类 加 载 的 请 求 ， 它 首先 不 会 自己 去 尝试 加 
载 请 求 最 终 都 应 该 传送 到 顶层 的 启动 类 加 载 器 中 ， 只 有 当 父 加 载 器 








载 这 个 类 ， 而 是 把 这 个 请 求 委派 给 父 类 加 载 器 去 完成 ， 每 一 个 层次 的 类 加 载 器 都 是 如 此 ， 
它 的 搜索 范围 中 没有 找到 所 需 的 类 ) 时 ， 子 加 载 器 才 会 尝试 自己 去 加 载 。 





因此 所 有 的 加 





反馈 自己 无 法 完成 这 个 加 载 请 求 ( 














使 用 双亲 委派 模型 来 组 织 类 加 载 器 之 间 的 关系 ， 有 一 个 显而易见 的 好 处 就 是 Java 类 随 着 它 的 类 加 
个 类 加 载 器 要 加 载 这 个 类 ， 最 终 都 是 委派 给 启动 类 加 载 器 进行 加 载 ， 




















载 器 一 起 具备 了 一 种 带 有 优先 级 的 层次 关系 。 例 如 类 java.lang.Object， 它 存放 在 rtjar 之 中 ， 无 论 哪 一 
因此 Object 类 在 程序 的 各 种 类 加 载 器 环境 中 都 是 同一 个 类 。 相 反 ， 如 果 没 有 使 用 双亲 委派 模型 ， 由 各 个 类 加 载 器 自行 去 加 载 的 话 ， 如 果 


自己 写 了 一 个 名 为 java.lang.Object 的 类 ， 并 放 在 程序 的 ClassPath 中 ， 那 系统 中 将 会 出 现 多 个 不 同 的 Object 类 ，Java 类 型 体系 中 最 基础 的 行为 也 就 无 从 保证 ， 应 用 程序 也 将 会 变 得 一 片 混乱 。 如 果 您 有 
兴趣 的 话 ， 可 以 尝试 去 写 一 个 与 [tjar 类 库 中 已 有 类 

































































名 的 Java 类 ， 将 会 发 现 可 以 正常 编译 ， 但 永远 无 法 被 加 载运 行 日。 








双亲 委派 模型 对 于 保证 Java 程 序 的 稳定 运作 很 重要 ， 但 它 的 实现 却 非常 简单 ， 实 现 双亲 委 派 的 代码 都 集中 在 java.lang.ClassLoader 的 loadClass() 方 法 之 中 ， 如 代码 清单 7-8 所 示 ， 逻 辑 清晰 易 懂 : 先 检 
查 是 否 已 经 被 加 载 过 ， 若 没有 加 载 则 调用 父 加 载 器 的 loadClass() 方 法 ， 若 父 加 载 器 为 空 则 默认 使 用 启动 类 加 载 器 作为 父 加 载 器 。 如 果 父 类 加 载 失 败 ， 则 在 抛 出 ClassNotFoundException 异 常 后 ， 再 调用 自 
己 的 findClass0 方 法 进行 加 载 。 






























































代码 清单 7-8 ”双亲 委派 模型 的 实现 





protected synchronized Class<?> loadClass (String name, boolean resolve) throws ClassNotFoundException 

// 首先 ， 检 查 请 求 的 类 是 否 已 经 被 加 载 过 了 
Class c = findLoadedClass (name); 
if (c = null) { 

try { 

if (parent != null) { 

Cc = parent.loadClass (name, false); 
} else { 


c= findBootstrapClassOrNull]l (name); 
} 


} catch (ClassNotFoundException e) 
// 如 果 父 类 加 载 器 抛 出 ClassNotFoundException 


// 则 说 明 父 类 加 载 器 无 法 完成 加 载 请 求 


主人 二 
// 


} 


== nul 


1) { 
在 父 类 加 载 器 无 法 加 载 的 时 候 
// 再 调用 本 身 的 findClass 方 法 来 进行 类 加 载 


c= findclass (name); 


} 
if (resolve) { 
resolveClass (c); 


} 


return es 


74.3 ”破坏 双亲 委派 模型 








上 文 提 到 过 双亲 委派 模型 并 不 是 一 个 强制 性 的 约束 模型 ， 而 是 Java 设 计 者 们 推荐 给 开发 者 们 的 类 加 载 器 实现 方式 。 在 Java 的 世界 里 面 大 部 分 的 类 加 载 器 都 遵循 这 个 模型 ， 但 也 有 例外 的 情况 ， 到 现在 为 





止 ， 双 亲 委 派 模型 主 








出 现 过 三 次 较 大 规模 的 “被 破坏 ”情况 。 


双亲 委派 模型 的 第 一 次 “被 破坏 ”其 实 发 生 在 双亲 委派 模型 出 现 之 前 一 一 即 JDK 1.2 发 布 之 前 。 由 于 双亲 委派 模型 在 JDK 1.2 之 后 才 被 引入 的 ， 而 类 加 载 器 和 抽象 类 java.lang.ClassLoader 则 在 JDK 1.0 时 








代 就 已 经 存在 ， 


方法 findClass0， 在 此 之 前 ， 用 户 去 继承 java.lang.ClassLoader 的 唯一 
自己 的 loadClass()。 











一 逻辑 就 是 去 调 








上 一 节 我 们 已 经 看 过 loadClass() 方 法 的 代码 ， 双 亲 委 派 的 
loadClass() 方 法 的 逻辑 里 如 果 父 类 加 载 失败 ， 则 会 调 有 





双亲 委派 模型 的 第 二 次 “被 破坏 ”是 由 这 个 模型 自身 的 缺陷 所 导致 的 ， 双 亲 委 派 很 好 地 解决 了 各 个 类 
的 AP1， 但 世事 往往 没有 绝对 的 完美 ， 如 果 基 础 类 又 要 调用 回 





础 ”， 是 因为 它们 总 是 作为 被 





这 并 非 是 不 可 能 的 事情 ， 一 个 典型 的 人 





面 对 已 经 存在 的 


0 



































的 就 是 为 了 重 写 loadClass() 方 法 ， 






























































户 代码 调 









































和 查找 ， 它 需要 调 








为 了 解决 这 个 困 


由 独立 厂商 实现 并 部 署 在 应 


























程序 的 ClassPath 下 的 JNDI 接 

















因为 虚拟 机 在 进行 类 加 载 的 时 候 会 调 


























体 逻 辑 就 实现 在 这 个 方法 之 中 ，JDK 1.2 之 后 已 不 提倡 有 
己 的 findClass() 方 法 来 完成 加 载 ， 这 样 就 可 以 保证 新 写 出 来 的 类 加 载 器 是 符合 双亲 委派 规则 的 。 





























户 再 去 覆 











自 定 义 类 加 载 器 的 实现 代码 ，Java 设 计 者 们 引入 双亲 委派 模型 时 不 得 不 做 出 一 些 受 协 。 为 了 向 前 兼容 ，JDK 1.2 之 后 的 java.lang.ClassLoader 添 加 了 一 个 新 的 protected 
加 载 器 的 私有 方法 loadClassinternal()， 而 这 个 方法 的 唯 


loadClass() 方 法 ， 而 应 当 把 自己 的 类 加 载 逻 辑 写 到 findClass0) 方 法 中 ,在 





载 器 的 基础 类 的 统一 问题 ( 越 基础 的 类 由 越 上 层 的 加 载 器 进行 加 载 ) ， 基 础 类 之 所 以 被 称 为 “ 基 





户 的 代码 ， 那 该 怎么 办 了 ? 


子 便 是 JNDI 服 务 ，JNDI 现 在 已 经 是 Java 的 标准 服务 ， 它 的 代码 由 启动 类 加 载 器 去 加 载 (在 JDK 1.3 时 代 放 进去 的 rtjar) ， 但 JNDI 的 
提供 者 (SPI，Service Provider Interface) 的 代码 ， 但 启动 类 加 


载 器 不 可 能 “认识 ” 














的 就 是 对 资源 进行 集中 管理 
这 些 代码 啊 ! 那 该 怎么 办 ? 











境 ，Java 设 计 团 队 只 好 引入 了 一 个 不 太 优雅 的 设计 : 线程 上 下 文 类 加 载 器 (Thread Context ClassLoader) 。 这 个 类 加 载 器 可 以 通过 java.lang.Thread 类 的 setContextClassLoaser() 方 





法 进行 设置 ， 如 果 旬 


有 了 线程 上 下 文 类 加 载 器 ， 就 可 以 做 一 些 
上 就 是 打通 了 双亲 委派 模型 的 


建 线程 时 还 未 设置 ， 它 将 会 从 父 线程 中 继承 一 个 ; 如 果 在 应 





JDBC、JCE、JAXB 和 JBI 等 。 


双亲 委派 模型 的 第 三 次 “被 破坏 ”是 由 于 


层次 结构 来 逆向 使 









































“ 舞 整 ”的 事情 了 ，JNDI 服 务 使 

































































了 就 是 希望 应 








Deployment) 等 ， 说 白 
次 其 实 没有 什么 大 不 了 的 ， 但 对 于 一 些 生产 系 统 来 说 ， 关 机 本 














类 加 载 器 ， 已 经 违背 了 双亲 委派 模型 的 一 


股 性 


这 个 线程 上 下 文 类 加 载 器 去 加 载 所 需要 的 SP 





程序 的 全 局 范围 内 都 没有 设置 过 ， 那 么 这 个 类 加 载 器 默认 就 是 应 











原则 ， 但 这 也 是 无 可 奈何 的 


























重启 机 器 就 能 立即 使 























在 JSR-297 团 、JSR-277 冉 范 从 纸 上 标准 变 成 真正 可 运行 的 程序 之 前 ，OSGi 是 当前 业界 


在 OSGi 环 境 下 ， 类 加 载 器 不 再 是 双亲 委派 模型 中 的 树 状 结构 ， 而 是 进一步 发 
(1) 将 以 ava.* 开 头 的 类 ， 委 派 给 父 类 加 载 器 加 载 。 


(2) 否则 ， 将 委派 列表 名 重 











a 内 的 类 ， 委 派 给 父 类 加 载 器 加 载 。 





(3) 否则 ， 将 Import 列 表 中 的 类 ， 委 派 给 Export 这 个 类 的 Bundle 的 类 加 载 器 加 载 。 


(4) 否则 ， 


(5) 否则 ， 


(6) 否则 ， 








(7) 否则 ， 


查找 类 是 否 在 


类 查找 失败 。 





查找 当前 Bundle 的 ClassPath， 使 用 自己 的 类 加 载 器 加 载 。 


查找 Dynamic Import 列 表 的 Bundle， 委 派 给 对 应 Bundle 的 类 加 载 器 加 载 。 


自己 的 Fragment Bundle 中 ， 如 果 在 ， 则 委派 给 Fragment Bundle 的 类 加 载 器 加 载 。 


上 面 的 查找 顺序 中 只 有 开头 两 点 仍然 符合 双亲 委派 规则 ， 其 余 的 类 查找 都 是 在 平 级 的 类 加 载 器 中 进行 的 。 

















笔者 虽然 使 








了 “被 破坏 ”这 个 词 来 形容 上 述 不 符 




















， 鼠 标 有 问题 或 
启 一 次 可 能 就 要 被 列 为 生产 事故 ， 这 种 情况 下 热 部 署 就 对 软件 开发 者 ， 尤 其 




















升级 就 换个 鼠标 ， 不 


程序 类 加 载 器 。 


代码 ， 也 就 是 父 类 加 载 器 请 求 子 类 加 载 器 去 完成 类 加 载 的 动作 ， 这 种 行为 实际 
情 。Java 中 所 有 涉及 SPI 的 加 载 动作 基本 上 都 采 上 




















这 种 方式 ， 例 如 JNDI、 


户 对 程序 动态 性 的 追求 而 导致 的 ， 这 里 所 说 的 “动态 性 ” 指 的 是 当前 一 些 非常 “ 热 ” 门 的 名 词 : 代码 热 蔡 换 (HotSwap) 、 模 块 热 部 署 (Hot 
程序 能 像 我 们 的 电脑 外 设 那样 ， 插 上 鼠标 或 U 盘 ， 不 



































停机 也 不 用 重启 。 对 于 个 人 电脑 来 说 ， 重 启 一 














是 企业 级 软件 开发 者 具有 很 大 的 吸引 力 。 














f 合 双亲 委派 模型 原则 的 行为 ， 但 这 里 “被 破坏 ”并 不 带 有 贬义 的 感情 色彩 。 只 











弄 懂 了 OSGi 的 实现 ， 











7.5 ”本 章 小 结 





然 就 明 F 








了 类 加 载 器 的 精粹 。 











1] 特 指 浏览 器 上 的 Java Applets， 在 其 他 领域 ， 如 智能 卡 上 ，Java Applets 仍然 有 很 广阔 的 市 场 。 


的 类 加 载 器 并 不 符合 传统 的 双亲 委派 的 类 加 载 器 ， 并 且 业 界 对 其 为 了 实现 热 部 署 而 带 来 的 额外 的 高 复杂 度 还 存在 不 少 争 





的 热 蔡 换 。 


有 足够 意义 和 理由 
议 ， 但 在 Java 程 序 员 中 基本 有 一 个 共识 : OSGi 中 对 类 加 载 器 的 使 





“事实 上 ”的 Java 模 块 化 标准 ， 而 OSGi 实 现 模块 化 热 部 署 的 关键 则 是 它 自 定义 的 类 加 载 器 机 制 的 实现 。 每 一 个 
程序 模块 (OSGi 中 称 为 Bundle) 都 有 一 个 自己 的 类 加 载 器 ， 当 需要 更 换 一 个 Bundle 时 ， 就 把 Bundle 连 同类 加 载 器 一 起 换 掉 以 实现 代码 





展 为 网 状 结构 ， 当 收 到 类 加 载 请 求 时 ，OSGi 将 按照 下 面 的 顺序 进行 类 搜索 : 


， 突 破 已 有 的 原则 就 可 算 作 一 种 创新 。 正 如 OSGi 中 
是 很 值得 学 习 的 ， 























2] 这 里 只 限于 Hot Spot， 像 MRP、Maxine 等 虚拟 机 ， 整 个 虚拟 机 本 身 都 是 由 Java 编 写 的 ，BootsttrapClassLoadetr 自 然 也 是 由 Java 语 言 实现 的 ， 而 不 是 由 C++ 实现 的 。 退 一 步 讲 ， 除 了 Hot Spot 外 的 其 他 两 个 高 性 能 
虚拟 机 JRockit 和 ]9 都 有 一 个 代表 Bootstrap ClassLoadet 的 Java 类 存在 ， 但 是 关键 方法 的 实现 仍然 是 使 用 NI 回调 到 C (注意 ， 不 是 C++) 的 实现 上 ， 这 个 Bootstrap ClassLoadet 的 实例 也 无 法 被 用 户 获 取 到 。 


即使 自 定义 了 自己 的 类 加 载 器 ， 强 行 用 defineClass0 方 法 去 加 载 一 个 以 “javalang” 开 头 的 类 也 不 会 成 功 。 如 果 读 者 尝试 这 样 做 的 话 ， 将 会 收 到 一 个 由 虚拟 机 自己 抛 出 


5] JSR-277 : Java Module System ( Java 模块 系统 ) 。 


的 “java.lang.SecurityException:Prohibited package name: javalang” 异 常 。 


4] JSR-294 : Improved Modularity Support in the Java Programming Language ( Java 编程 语言 中 的 改进 模块 性 支持 ) 。 





本 章 介绍 了 类 加 载 过 程 的 “加 载 ”、“ 验 证 ”、“ 准 备 ”、 “解析 ”和 “初始 化 ”五 个 阶段 中 虚拟 机 进行 了 哪些 动作 ， 还 介绍 了 类 加 载 器 的 工作 原理 及 其 对 虚拟 机 的 意义 。 


副 
和 导 
十 





经 过 第 6、7 两 章 的 讲解 ， 相 信 您 已 经 对 如 何在 Class 文 件 中 定义 类 ， 如 何 将 类 加 载 到 虚拟 机 中 这 两 个 问题 有 了 一 个 比较 系统 的 了 解 ， 下 一 章 我 们 将 一 起 来 看 看 虚拟 机 如 何 执行 定义 在 Class 文 件 里 的 
码 。 


第 8 章 “虚拟 机 字 节 码 执行 引擎 


本 章 主要 内 容 





“概述 

“ 运行 时 栈 帧 结构 

“ 方法 调用 

“ 基于 栈 的 字 节 码 解释 执行 引擎 


代码 编译 的 结果 是 从 本 地 机 器 码 转变 为 字 节 码 ， 是 存储 格式 发 展 的 一 小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 








8.1 概述 











雪 行 引 警 是 Java 虚 拟 机 最 核心 的 组 成 部 分 之 一 。 “虚拟 机 ”是 一 个 相对 于 “物理 机 ”的 概念 ， 这 两 种 机 器 都 有 代码 执行 能 力 ， 其 区 别 是 物理 机 的 执行 引擎 是 直接 建立 在 处 理 器 、 硬 件 、 指 令 集 和 操作 系 
统 层面 上 的 ， 而 虚拟 机 的 执行 引擎 则 是 由 自己 实现 的 ， 因 此 可 以 自行 制定 指令 集 与 执行 引擎 的 结构 体系 ， 并 且 能 够 执行 那些 不 被 硬件 直接 支持 的 指令 集 格式 。 












































在 Java 虚 拟 机 规范 中 制定 了 虚拟 机 字 节 码 执行 引 警 的 概念 模型 ， 这 个 概念 模型 成 为 各 种 虚拟 机 执行 引 警 的 统一 外 观 (Facade) 。 在 不 同 的 虚拟 机 实现 里 面 ， 执 行 引擎 在 执行 Java 代 码 的 时 候 可 能 有 解释 








执行 通过 解释 器 执行 和 编译 执行 〈 通 过 即时 编译 器 产生 本 地 代码 执行 ) 两 种 选择 0]， 也 可 能 两 者 兼备 ， 甚 至 还 可 能 包含 几 个 不 同 级 别 的 编译 器 执行 引擎 。 但 从 外 观 上 看 起 来 ， 所 有 的 Java 虚 拟 机 的 执行 
引擎 都 是 一 致 的 : 输入 的 是 字 节 码 文件 ， 处 理 过 程 是 字 节 码 解析 的 等 效 过 程 ， 输 出 的 是 执行 结果 。 本 章 将 主要 从 概念 模型 的 角度 来 讲解 虚拟 机 的 方法 调用 和 字 节 码 执行 。 


























[由 有 一 些 虚 拟 机 (如 Sun Classic VM) 的 内 部 只 存在 解释 器 ， 只 能 解释 执行 ， 另 外 一 些 虚 拟 机 (如 BEA JRockit) 的 内 部 只 存在 即时 编译 器 ， 只 能 编译 执行 。 


8.2 ”运行 时 栈 帧 结构 

















栈 帧 (Stack Frame) 是 用 于 支持 虚拟 机 进行 方法 调用 和 方法 执行 的 数据 结构 ， 它 是 虚拟 机 运行 时 数据 区 中 的 虚拟 机 栈 (Virtual Machine Stack) 【1 的 酰 元素 。 栈 帧 存储 了 方法 的 局 部 变量 表 、 操 作 数 
栈 、 动 态 连 接 和 方法 返回 地 址 等 信息 。 每 一 个 方法 从 调用 开始 到 执行 完成 的 过 程 ， 就 对 应 着 一 个 栈 帧 在 虚拟 机 栈 里 面 从 入 栈 到 出 栈 的 过 程 。 



































每 一 个 栈 帧 都 包括 了 局 部 变量 表 、 操 作 数 栈 、 动 态 连接 、 方 法 返回 地 址 和 一 些 额外 的 附加 信息 。 在 编译 程序 代码 的 时 候 ， 栈 帧 中 需要 多 大 的 局 部 变量 表 、 多 深 的 操作 数 栈 都 已 经 完全 确定 了 ， 并 且 写 入 





























到 方法 表 的 Code 属 性 之 中 咎 ， 因 此 一 个 栈 帧 需要 分 配 多 少 内存 ， 不 会 受到 程序 运行 期 变量 数据 的 影响 ， 而 仅仅 取决 于 具体 的 虚拟 机 实现 。 




















一 个 线程 中 的 方法 调用 链 可 能 会 很 长 ， 很 多 方法 都 同时 处 于 执行 状态 。 对 于 执行 引擎 来 讲 ， 活 动 线程 中 ， 只 有 栈 项 的 栈 帧 是 有 效 的 ， 称 为 当前 栈 帧 (Current Stack Frame) ， 这 个 栈 帧 所 关联 的 方法 
称 为 当前 方法 (Current Method) 。 执 行 引擎 所 运行 的 所 有 字 节 码 指 令 都 只 针对 当前 栈 帧 进行 操作 ， 栈 帧 的 概念 结构 如 图 8-1 所 示 。 
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接 下 来 我 们 将 详细 了 解 一 下 栈 帧 中 的 局 部 变量 表 、 操 作 数 栈 、 动 态 连 接 、 方 法 返回 地 址 等 各 个 部 分 的 作用 和 数据 结构 。 





8.2.1 局 部 变量 表 






































局 部 变量 表 是 一 组 变量 值 存 储 空间 ， 用 于 存放 方法 参数 和 方法 内 部 定义 的 局 部 变量 。 在 Java 程 序 被 编译 为 Class 文 件 时 ， 就 在 方法 的 Code 属 性 的 max_locals 数 据 项 中 确定 了 该 方法 所 需要 分 配 的 最 大 局 


部 变量 表 的 容量 。 





























既然 前 面 提 到 了 数据 类 型 ， 在 此 顺便 说 一 下 ， 一 个 Slot 可 以 存放 一 个 32 位 以 内 的 数据 类 型 ，Java 中 点 
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图 8-1 栈 帧 的 概念 结构 


局 部 变量 表 的 容量 以 变量 槽 (Variable Slot， 下 称 Slot) 为 最 小 单位 ， 虚 拟 机 规范 中 并 没有 明确 指明 一 个 Slot 应 占用 
byte、char、short、int、float、reference 或 returnAddress 类 型 的 数据 ， 这 种 描述 与 明确 指出 “每 个 Slot 占 
同 而 发 生变 化 。 不 过 无 论 如 何 ， 即 使 在 64 位 虚拟 机 中 使 





























了 64 位 长 度 的 内 存 空 间 来 实现 一 个 Slot， 





























returnAddress 八 种 类 型 。 前 面 六 种 不 需 











实现 至 少 都 应 当 能 从 此 引 








中 直接 或 间接 地 查找 到 对 象 在 Java 堆 中 的 起 始 地 址 索引 和 方法 








多 加 解释 ， 大 家 都 认识 ， 而 后 面 的 reference 是 对 象 的 引 F 























32 位 长 度 的 


线程 2 线程 " 








32 位 以 内 的 数据 类 型 有 boolean、byte、char、short、int、float、referenceDB] 和 
。 虚 拟 机 规范 既 没 有 说 明 它 的 长 度 ， 也 没有 明确 指出 这 个 引 
区 中 的 对 象 类 型 数据 。 而 returnAddress 是 为 字 节 码 指令 jsr、jsr_w 和 ret 




















应 有 怎样 的 结构 ， 但 是 一 般 来 说 ， 
民 务 的 ， 它 指向 了 一 条 字 节 码 指令 的 地 址 。 


的 内 存 空间 大 小 ， 只 是 很 有 “导向 性 ”地 说 明 每 个 Slot 都 应 该 能 存放 一 个 boolean、 
内 存 空间 ”有 一 些 差别 ， 它 允许 Slot 的 长 度 随 着 处 理 器 、 操 作 系统 或 虚拟 机 的 不 
虚拟 机 仍 要 使 用 对 齐 和 补 白 的 手段 让 Slot 在 外 观 上 看 起 来 与 32 位 虚拟 机 中 的 一 致 。 


虚拟 机 





对 于 64 位 的 数据 类 型 ， 虚 拟 机 会 以 高 位 在 前 的 方式 为 其 分 配 两 个 连续 的 Slot 空间 。Java 语 言 中 明确 规定 的 64 位 的 数据 类 型 只 有 long 和 double 两 种 (reference 类 型 则 可 能 是 32 位 也 可 能 是 64 位 ) 。 值 得 


一 提 的 是 ， 这 里 把 long 和 double 数 
一 下 。 不 过 ， 由 于 局 





部 变量 表 建 立 在 线程 的 堆栈 上 ， 是 线程 私有 的 数 拉 





居 类 型 分 割 存储 的 做 法 与 “long 和 double 的 非 原 子 性 协定 ”中 把 一 次 long 和 double 数 据 类 型 读 写 分 割 为 两 次 32 位 读 写 
居 ， 无 论 读 写 两 个 连续 的 Slot 是 否 是 原子 操作 ， 都 不 会 引起 数据 安全 问题 内 。 




















虚拟 机 通过 索引 定位 的 方式 使 
明 要 使 用 第 n 和 第 n+1 两 个 Slot。 












































局 部 变量 表 ， 索 引 值 的 范围 是 从 0 开始 到 局 部 变量 表 最 大 的 Slot 数量 。 如 果 是 32 位 数据 类 型 的 变量 ， 索 引 n 就 代表 了 使 











在 方法 执行 时 ， 虚 拟 机 是 使 




















余 的 Slot。 


， 在 方法 中 可 以 通过 关键 字 “this” 来 访问 这 个 隐 含 的 参数 。 其 余 参数 则 按照 参数 表 的 顺序 来 排列 ， 占 ， 


局 部 变量 表 完 成 参数 值 到 参数 变量 列表 的 传递 过 程 的 ， 如 果 是 实例 方法 ( 非 static 的 方法 ) ， 那 么 局 部 变量 表 中 第 0 位 索引 的 Slot 默认 是 用 于 传递 方法 所 












































从 1 开始 的 





的 做 法 类 似 ， 读 者 阅读 到 java 内存 模 型 时 可 以 对 比 


第 n 个 slot， 如 果 是 64 位 数据 类 型 的 变量 ， 则 说 


属 对 象 实例 的 引 








局 部 变量 Slot， 参 数 表 分 配 完毕 后 ， 表 根据 方法 体内 部 定义 的 变量 顺序 和 作 : 





域 分 配 其 





















































局 部 变量 表 中 的 Slot 是 可 重用 的 ， 方 法 体 中 定义 的 变量 ， 其 作用 域 并 不 一 定 会 覆盖 整个 方法 体 ， 如 果 当 前 字 节 码 PC 计 数 器 的 值 已 经 超出 了 某 个 变量 的 作用 域 ， 那 么 这 个 变量 对 应 的 Slot 就 可 以 交 给 其 他 
变量 使 用 。 这 样 的 设计 不 仅仅 是 为 了 节省 栈 空间 ， 在 某 些 情况 下 Slot 的 复 用 会 直接 影响 到 系统 的 垃圾 收集 行为 ， 请 看 代码 清单 8-1 的 演示 。 



















































































代码 清单 8-1 局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 一 


























public static void main (String[] args) () { 
byte[] Placeholder = new byte[64 * 1024 * 1024]; 
System.gc () 7 

} 


代码 清单 8-1 中 的 代码 很 简单 ， 向 内 存 填充 了 64MB 的 数据 ， 然 后 通知 虚拟 机 进行 垃圾 收集 。 我 们 在 虚拟 机 运行 参数 中 加 上 “-verbose: gc” 来 看 看 垃圾 收集 的 过 程 ， 发 现在 System.gc() 运 行 后 并 没有 
回收 掉 这 64MB 的 内 存 ， 下 面 是 运行 的 结果 : 








[GC 66846K->65824K(125632K) ，0.0032678 secs 
[Full GC 65824K->65746K(125632K), 0.0064131 secs] 

















因为 在 执行 System.gc0 时 ， 变 量 placeholder 还 处 于 作用 域 之 内 ， 虚 拟 机 自然 不 敢 回收 掉 placeholder 的 内 存 。 我 们 把 代码 修改 一 下 ， 变 成 代码 清单 8-2 




















没有 回收 掉 placeholder 所 占 的 内 存 能 说 得 过 去 
中 的 样子 。 


























代码 清单 8-2 局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 二 























public static void main(String[] args) () { 
{ 
byte[] Placeholder = new byte[64 * 1024 * 1024]; 


System.gc () 7 
} 























加 入 了 花 括号 之 后 ，placeholder 的 作用 域 被 限制 在 花 括号 之 内 ， 从 代码 逻辑 上 讲 ， 在 执行 System.gc(0 的 时 候 ，placeholder 已 经 不 可 能 再 被 访问 了 ， 但 执行 一 下 这 段 程序 ， 会 发 现 运行 结果 如 下 ， 还 是 
有 64MB 的 内 存 没 有 被 回收 掉 ， 这 又 是 为 什么 呢 ? 


[GC 66846K->65888K(125632K) ，0.0009397 secs] 
[Full GC 65888K->65746K (125632K) ，0.0051574 secs] 











在 解释 为 什么 之 前 ， 我 们 先 对 这 段 代 码 进行 第 二 次 修改 ， 在 调用 System.gc() 之 前 加 入 一 行 代码 “int a=0; ”， 变 成 代码 清单 8-3 的 样子 。 



































代码 清单 8-3 ”局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 三 








public static void main (String[] args) () { 
byte[] Placeholder = new byte[64 * 1024 * 1024]; 
int a= 0; 


System.gc () 7 
} 





这 个 修改 看 起 来 很 莫名 其 妙 ， 但 运行 一 下 程序 ， 却 发 现 这 次 内 存 真 的 被 正确 回收 了 : 





回 








[GC 66401K->65778K(125632K), 0.0035471 secs] 
[Full GC 65778K->218K(125632K), 0.0140596 secs] 
































代码 清单 8-1 至 8-3 中 ，placeholder 能 否 被 回收 的 根本 原因 就 是 : 局 部 变量 表 中 的 Slot 是 否 还 存 有 关于 placeholder 数 组 对 象 的 引用 。 第 一 次 修改 中 ， 代 码 虽 然 已 经 离开 了 placeholder 的 作用 域 ， 但 在 此 
之 后 ， 没 有 任何 对 局 部 变量 表 的 读 写 操作 ，placeholder 原 本 所 占用 的 Slot 还 没有 被 其 他 变量 所 复 用 ， 所 以 作为 GC Roots 一 部 分 的 局 部 变量 表 仍 然 保 持 着 对 它 的 关联 。 这 种 关联 没有 被 及 时 打 断 ， 在 绝 大 部 
分 情况 下 影响 都 很 轻微 。 但 如 果 遇 到 一 个 方法 ， 其 后 面 的 代码 有 一 些 耗 时 很 长 的 操作 ， 而 前 面 又 定义 了 占用 了 大 量 内 存 、 实 际 上 已 经 不 会 再 被 使 用 的 变量 ， 手 动 将 其 设置 为 null 值 (用 来 代替 “int 
a=0; ”， 把 变量 对 应 的 局 部 变量 表 Slot 清空 ) 就 不 是 一 个 毫 无 意义 的 操作 ， 这 种 操作 可 以 作为 一 种 在 极 特殊 情形 (对 象 占用 内 存 大 、 此 方法 的 栈 帧 长 时 间 不 能 被 回收 、 方 法 调用 次 数 达 不 到 JIT 的 编译 条 
件 ) 下 的 “ 奇 技 ”来 使 用 。 但 不 应 当 对 赋 null 值 操作 有 过 多 的 依赖 ， 也 没有 必要 把 它 当做 一 个 普遍 的 编码 方法 来 推广 让。 以 恰当 的 变量 作用 域 来 控制 变量 回收 时 间 才 是 最 优雅 的 解决 方法 ， 如 代码 清单 8-3 那 
样 的 场景 并 不 多 见 。 























































































































































































































另外 ， 赋 null 值 的 操作 在 经 过 虚拟 机 JIT 编 译 器 优化 之 后 会 被 消除 掉 ， 这 时 候 将 变量 设置 为 null 实 际 上 是 没有 意义 的 。 字 节 码 被 编译 为 本 地 代码 后 ， 对 GC Roots 的 枚 举 也 与 解释 执行 时 期 有 所 差别 ， 代 码 
和 8-2 在 经 过 JIT 编 译 后 ，System.gc() 执 行 时 就 可 以 正确 地 回收 掉 内 存 ， 而 无 须 写成 代码 清单 8-3 的 样子 了 。 
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关于 局 部 变量 表 ， 还 有 一 点 可 能 会 对 实际 开发 产生 影响 ， 就 是 局 部 变量 不 像 前 面 介绍 的 类 变量 那样 存在 “准备 阶段 ”。 通 过 前 一 章 的 讲解 ， 我 们 已 经 知道 类 变量 有 两 次 赋 初 始 值 的 过 程 ， 一 次 在 准备 阶 
段 ， 赋 予 系统 初始 值 ; 另外 一 次 在 初始 化 阶段 ， 赋 予 程序 员 定 义 的 初始 值 。 因 此 即使 在 初始 化 阶段 程序 员 没有 为 类 变量 赋值 也 没有 关系 ， 类 变量 仍然 具有 一 个 确定 的 初始 值 。 但 局 部 变量 就 不 一 样 了 ， 如 果 
一 个 局 部 变量 定义 了 但 没有 赋 初 始 值 是 不 能 使 用 的 。 所 以 不 要 认为 Java 中 任何 情况 下 都 存在 诸如 整 型 变量 默认 为 0、 布 尔 型 变量 默认 为 false 之 类 的 默认 值 。 如 代码 清单 8-4 所 示 ， 这 段 代 码 其 实 并 不 能 运行 ， 
所 幸 编译 器 能 在 编译 期 间 检查 到 并 提示 这 一 点 。 即 便 编 译 器 能 通过 手动 生成 字 节 码 的 方式 制造 出 下 面 的 代码 效果 ， 字 节 码 检验 的 时 候 也 会 被 虚拟 机 发 现 ， 从 而 导致 类 加 载 失 败 。 













































































代码 清单 8-4 ”未 赋值 的 局 部 变量 





public static void main (String[] args) { 
int a; 
System.out .println (a); 

} 


8.2.2 ”操作 数 栈 








操作 数 栈 也 常 被 称 为 操作 栈 ， 它 是 一 个 后 入 先 出 (Last In First Out，LIFO) 栈 。 同 局 部 变量 表 一 样 ， 操 作 数 栈 的 最 大 深度 也 在 编译 的 时 候 被 写 入 到 Code 属 性 的 max_stacks 数 据 项 之 中 。 操 作 数 栈 的 每 
一 个 元 素 可 以 是 任意 的 Java 数 据 类 型 ， 包 括 long 和 double。32 位 数据 类 型 所 占 的 栈 容量 为 1，64 位 数据 类 型 所 占 的 栈 容量 为 2。 在 方法 执行 的 任何 时 候 ， 操 作 数 栈 的 深度 都 不 会 超过 在 max_stacks 数 据 项 中 
设 定 的 最 大 值 。 








当 一 个 方法 刚刚 开始 执行 的 时 候 ， 这 个 方法 的 操作 数 栈 是 空 的 ， 在 方法 的 执行 过 程 中 ， 会 有 各 种 字 节 码 指令 向 操作 数 栈 中 写 入 和 提取 内 容 ， 也 就 是 入 栈 出 栈 操作 。 例 如 ， 在 做 算术 运算 的 时 候 是 通过 操 
作 数 栈 来 进行 的 ， 又 或 者 在 调用 其 他 方法 的 时 候 是 通过 操作 数 栈 来 进行 参数 传递 的 。 












































举 个 例子 ， 整 数 加 法 的 字 节 码 指令 jadd 在 运行 的 时 候 要 求 操作 数 栈 中 最 接近 栈 顶 的 两 个 元 素 已 经 存 入 了 两 个 int 型 的 数值 ， 当 执行 这 个 指令 时 ， 会 将 这 两 个 int 值 出 栈 并 相 加 ， 然 后 将 相 加 的 结果 入 栈 。 








操作 数 栈 中 元 素 的 数据 类 型 必须 与 字 节 码 指令 的 序列 严格 匹配 ， 在 编译 程序 代码 的 时 候 ， 编 译 器 要 严格 保证 这 一 点 ， 在 类 校 验 阶段 的 数据 流 分 析 中 还 要 再 次 验证 这 一 点 。 再 以 上 面 的 jadd 指 令 为 例 ， 这 
个 指令 用 于 整 型 数 加 法 ， 它 在 执行 时 ， 最 接近 栈 顶 的 两 个 元 素 的 数据 类 型 必须 为 int 型 ， 不 能 出 现 一 个 long 和 一 个 float 使 用 add 命 令 相 加 的 情况 。 









































另外 ， 在 概念 模型 中 ， 两 个 栈 帧 作为 虚拟 机 栈 的 元 素 ， 相 互 之 间 是 完全 独立 的 。 但 是 大 多 数 虚拟 机 的 实现 里 都 会 做 一 些 优化 处 理 ， 令 两 个 栈 帧 出 现 一 部 分 重 坪 。 让 下 面 栈 帧 的 部 分 操作 数 栈 与 上 面 栈 帧 
的 部 分 局 部 变量 表 重 晋 在 一 起 ， 这 样 在 进行 方法 调用 时 就 可 以 共用 一 部 分 数据 ， 而 无 须 进行 额外 的 参数 复制 传递 了 ， 重 考 的 过 程 如 图 8-2 所 示 。 



























































其 地 枝 帆 信息 


局 部 变量 表 





操作 数 栈 共 享 区 域 重要 区 域 局 部 变量 表 共 享 区 域 





操作 数 栈 


其 地标 帖 信息 


图 8-2 ”两 个 栈 帧 之 间 的 数据 共享 





Java 虚 拟 机 的 解释 执行 引擎 称 为 “基于 栈 的 执行 引擎 ”， 其 中 所 指 的 “ 栈 ” 就 是 操作 数 栈 。 本 章 稍 后 会 对 基于 栈 的 代码 过 程 进行 更 详细 的 讲解 。 


8.2.3 ”动态 连接 









































每 个 栈 帧 都 包含 一 个 指向 运行 时 常量 池 [中 该 栈 帧 所 属 方法 的 引用 ， 持 有 这 个 引用 是 为 了 支持 方法 调用 过 程 中 的 动态 连接 。 通 过 第 6 章 的 讲解 ， 我 们 知道 Class 文 件 的 常量 池 中 存 有 大 量 的 符号 引用 ， 字 
节 码 中 的 方法 调用 指令 就 以 常量 池 中 指向 方法 的 符号 引用 为 参数 。 这 些 符号 引用 一 部 分 会 在 类 加 载 阶段 或 第 一 次 使 用 的 时 候 转化 为 直接 引用 ， 这 种 转化 称 为 静态 解析 。 另 外 一 部 分 将 在 每 一 次 的 运行 期 间 转 
化 为 直接 引用 ， 这 部 分 称 为 动态 连接 。 关 于 这 两 个 转化 过 程 的 详细 信息 ， 将 在 8.3 节 中 再 详细 讲解 。 








































































































8.2.4 方法 返回 地 址 












































当 一 个 方法 被 执行 后 ， 有 两 种 方式 退出 这 个 方法 。 第 一 种 方式 是 执行 引擎 遇 到 任意 一 个 方法 返回 的 字 节 码 指令 ， 这 时 候 可 能 会 有 返回 值 传递 给 上 层 的 方法 调用 者 (调用 当前 方法 的 方法 称 为 调用 者 ) ， 
是 否 有 返回 值 和 返回 值 的 类 型 将 根据 遇 到 何 种 方法 返回 指令 来 决定 ， 这 种 退出 方法 的 方式 称 为 正常 完成 出 口 (Normal Method Invocation Completion) 。 























另外 一 种 退出 方式 是 ， 在 方法 执行 过 程 中 遇 到 了 异常 ， 并 且 这 个 异常 没有 在 方法 体内 得 到 处 理 ， 无 论 是 java 虚拟 机 内 部 产生 的 异常 ， 还 是 代码 中 使 用 athrow 字 节 码 指令 产生 的 异常 ， 只 要 在 本 方法 的 异 
常 表 中 没有 搜索 到 匹配 的 异常 处 理 器 ， 就 会 导致 方法 退出 ， 这 种 退出 方法 的 方式 称 为 异常 完成 出 口 (Abrupt Method Invocation Completion) 。 一 个 方法 使 用 异常 完成 出 口 的 方式 退出 ， 是 不 会 给 它 的 上 
县 调用 者 产生 任何 返回 值 的 。 




























































































无 论 采用 何 种 退出 方式 ， 在 方法 退出 之 后 ， 都 需要 返回 到 方法 被 调用 的 位 置 ， 程 序 才能 继续 执行 ， 方 法 返回 时 可 能 需要 在 栈 帧 中 保存 一 些 信息 ， 用 来 帮助 恢复 它 的 上 层 方 法 的 执行 状态 。 一 般 来 说 ， 方 
法 正常 退出 时 ， 调 用 者 的 PC 计数 器 的 值 就 可 以 作为 返回 地 址 ， 栈 帧 中 很 可 能 会 保存 这 个 计数 器 值 。 而 方法 异常 退出 时 ， 返 回 地 址 是 要 通过 异常 处 理 器 表 来 确定 的 ， 栈 帧 中 一 般 不 会 保存 这 部 分 信息 。 

































































方法 退出 的 过 程 实际 上 等 同 于 把 当前 栈 帧 出 栈 ， 因 此 退出 时 可 能 执行 的 操作 有 : 恢复 上 层 方法 的 局 部 变量 表 和 操作 数 栈 ， 把 返回 值 (如 果 有 的 话 ) 压 入 调用 者 栈 帧 的 操作 数 栈 中 ， 调 整 PC 计数 器 的 值 以 
指向 方法 调用 指令 后 面 的 一 条 指令 等 。 


























8.2.5 ”附加 信息 























虚拟 机 规范 允许 具体 的 虚拟 机 实现 增加 一 些 规范 里 没有 描述 的 信息 到 栈 帧 之 中 ,例如 与 调试 相关 的 信息 ， 这 部 分 信息 完全 取决 于 具体 的 虚拟 机 实现 ， 这 里 不 再 详 述 。 在 实际 开发 中 ， 一 般 会 把 动态 连 











接 、 方 法 返回 地 址 与 其 他 附加 信息 全 部 归 为 一 类 ， 称 为 栈 帧 信息 。 


的 reference 








1] 详细 内 容 广 


2] 详细 内 容 广 


吾 


参见 2.2 节 的 相关 内 容 。 


参见 6.3.7 节 的 相关 内 容 。 
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长 度 。 


8.3 方法 调用 


方法 调 











并 不 等 同 于 方法 执行 ， 方 法 调 











说 的 直接 引用 ) 。 这 个 特性 给 Java 带 来 了 更 强大 的 动态 扩 
8.3.1 解析 
继续 前 面 关 于 方法 调用 的 话题 ， 所 有 方法 调 














是 : 方法 在 程序 真正 运行 之 前 就 有 一 个 可 确定 的 调 
































阶段 唯一 的 任务 就 是 确定 被 调 
的 操作 ， 但 前 面 已 经 讲 过 ，Class 文 件 的 编译 过 程 中 不 包含 传统 编译 中 的 连接 步 又， 一 切 方法 调 
展 能 力 ， 但 也 使 得 
































方法 的 版 本 〈 即 调 


ava 方 法 的 调 
































哪 一 个 方法 
在 Class 文 件 


引 这 是 Java 内 存 模型 中 定义 的 内 容 ， 关 于 原子 操作 与 “long 和 double 的 非 原子 性 协定 ”等 问题 ， 将 在 本 书 第 12 章 中 再 做 详细 讲解 。 





























过 程 变 得 相对 复杂 起 来 ， 需 要 在 类 加 载 期 间 甚至 到 








中 的 目标 方法 在 Class 文 件 里 面 都 是 一 个 常量 池 中 的 符号 引 




















为 解析 (Resolution) 。 


在 Java 语 言 中 ， 符 





出 其 他 版 本 


与 之 相对 应 ， 在 Java 虚 拟 机 号 








’ 














版 本 ， 并 且 这 个 方法 的 调 






































面 提供 了 








条 方法 调 




















* invok 


estatic: 调用 静态 方法 。 


f 合 “编译 期 可 知 ， 运 行 期 不 可 变 ”这 个 要 求 的 方法 了 
因此 它们 都 适合 在 类 加 载 阶段 进行 解析 。 





字 节 码 指令 [0， 分 别 是 : 


' invokespecial: 调用 实例 构造 器 <init> 方 法 、 私 有 方法 和 父 类 方法 。 


* invok 


evirtual: 调用 所 有 的 虚 方 法 。 


' invokeintetface: 调用 接口 方法 ， 会 在 运行 时 再 确定 一 个 实现 此 接口 的 对 象 。 


只 要 能 被 invokestatic 和 invokespecial 指 令 调 
解析 为 该 方法 的 直接 引 


sayHello0 只 可 能 








3 









































代码 清单 8-5 方法 静态 解析 演示 


大 大 


* 方法 表 
x 


第 态 解析 演示 


* @author zzm 


«yf 


public class StaticResolution { 
public static void sayHello() { 


System.out .println ("hello world"); 




















public static void main (String[] args) { 


Stat. 
} 
} 


icResolution.sayHello(); 


























D:\Develop\>javap -verbose StaticResolution 
public static void main (java.lang.String[])7 


Code: 


Stack=0, Locals=]1, Args size=]1l 


Os 
3: 


invokestatic 
return 


LineNumberTable: 


line 
line 


Java 中 的 非 虚 方法 除了 使 


本 ， 所 以 也 无 须 对 方法 接收 者 进行 多 态 选 择 ， 又 或 者 说 多 态 选 择 的 


15: 0 
Td 3 
































解析 调 
态 的 也 可 能 是 动态 的 ， 根 据 分 派 依据 的 宗 量 数 让 可 分 为 
法 分 派 是 如 何 进行 的 。 
83.2 分 派 


众所周知 ，Java 是 一 门面 向 对 象 的 程序 设计 语言 ， 
写 ”) ， 在 Java 中 是 如 何 实现 的 ， 这 里 的 实现 当然 不 是 语法 上 该 如 


1. 静 态 分 派 


在 开始 讲解 静态 分 派 B] 前 ， 笔 者 准备 了 一 段 经 常 出 现在 面试 题 中 的 程序 代码 ， 读 者 不 妨 先 看 一 遍 ， 想 一 下 程序 的 输出 结果 是 什么 。 后 面 我 们 的 话题 将 围 








#31; //Method sayHello: ()V 


invokestatic 和 invokespecial 调 





使 用 avap 命 令 查看 这 段 程序 的 字 节 码 ， 会 发 现 的 确 是 通过 invokestatic 命 令 来 调 




















版 本 在 运行 期 是 不 可 改变 的 。 














5] 《 Practical Java》 一 书 中 推荐 把 所 有 不 再 需要 的 引用 手工 赋 null 值 ， 但 没有 明确 说 明 原 因 ， 笔 者 认为 这 样 做 是 没有 必要 的 ， 读 完 本 节 后 读者 可 以 自行 思考 。 
0] 运行 时 常量 池 的 相关 内 容 详 见 第 2 章 。 


， 暂 时 还 不 涉及 方法 内 部 的 具体 运行 过 程 。 在 程序 运行 时 ， 进 行 方法 调 


3] Java 虚拟 机 规范 中 没有 明确 规定 reference 类 型 的 长 度 ， 它 的 长 度 与 实际 使 用 32 还 是 64 位 的 虚拟 机 有 关 ， 如 果 是 64 位 虚拟 机 ， 还 与 是 否 开启 某 些 对 象 指 针 压 缩 的 优化 有 关 ， 这 里 我 们 暂且 只 取 32 位 虚拟 机 

















最 频繁 


是 最 普遍 、 




















面 存储 的 都 只 是 符号 引用 ， 而 不 是 方法 在 实际 运行 时 内 存 布 








局 中 的 入 口 地 址 (相当 于 之 前 所 











运行 期 间 才 能 确定 目标 方法 的 


直接 引用 。 






































换 句 话说 ， 调 











， 在 类 加 载 的 解析 阶段 ， 会 将 其 中 的 一 部 分 符号 引 
目标 在 程序 代码 写 好 、 编 译 器 进行 编译 时 就 必须 确定 下 来 。 这 类 方法 的 调用 称 








要 有 静态 方法 和 私有 方法 两 大 类 ， 前 者 与 类 型 直接 关联 ， 














的 方法 ， 都 可 以 在 解析 阶段 确定 唯一 的 调 



































sayHello() 方 法 的 : 


的 方法 之 外 还 有 一 种 ， 就 是 被 final 修 饰 的 方法 。 虽 然 final 方 法 是 使 有 
结果 肯定 是 唯一 的 。 在 Java 语 言 规范 中 明确 说 明了 final 方 法 是 一 种 
































一 定 是 个 静态 的 过 程 ， 在 编译 期 间 就 完全 确定 ， 在 类 装载 的 解析 阶段 就 会 把 涉及 的 符号 引 











因为 Java 


哲 : 














面向 对 象 的 三 个 其 














本 特征 : 继承 、 封 装 和 多 态 。 本 节 讲 解 的 分 派 调 
何 写 ， 我 们 关心 的 依然 是 虚拟 机 如 何 确定 正确 的 目标 方法 。 


部 转变 为 可 确定 的 直接 引 
分 派 和 多 分 派 。 这 两 类 分 派 方式 两 两 组 合 就 构成 了 静态 单 分 派 、 静 态 多 分 派 、 动 态 和 


invokevirtual 指 令 来 调 
EE 虚 方 法 。 











转化 为 直接 引 

















， 这 种 解析 能 成 立 的 前 提 

















后 者 在 外 部 不 可 被 访问 ， 这 两 种 方法 都 不 可 能 通过 继承 或 别 的 方式 重 写 





版 本 ， 符 合 这 个 条 件 的 有 静态 方法 、 私 有 方法 、 实 例 构 造 器 和 父 类 方法 四 类 ， 它 们 在 类 加 载 的 时 候 就 会 把 符 


















































分 派 、 动 态 儿 分派 
































。 这 些 方法 可 以 称 为 非 虚 方法 ， 与 之 相反 ， 其 他 方法 就 称 为 虚 方法 (除去 final 方 法 ， 后 文 会 提 到 ) 。 代 码 清单 8-5 演 示 了 一 个 最 常见 的 解析 调 | 
属于 类 型 staticResolution， 没 有 任何 手段 可 以 材 盖 或 隐 茂 这 个 方法 。 


， 不 会 延迟 到 运行 期 再 去 完成 。 而 分 派 (Dispatch) 调 














0 








过 程 将 会 揭示 多 态 性 特征 的 一 些 最 





基本 的 体现 (如 “ 重 载 和 “ 重 








的 例子 ， 此 样 例 中 ， 静 态 方法 





的 ， 但 是 由 于 它 无 法 被 覆盖 ， 没 有 其 他 版 

















则 可 能 是 静 





种 分 派 情 况 ， 下 面 我 们 看 看 虚拟 机 中 的 方 





























绕 这 个 类 的 方法 来 重 载 (Overload) 代码 ， 以 分 





析 虚 拟 机 和 编译 器 确定 方法 版 本 的 过 程 。 程 序 如 代码 清单 8-6 所 示 。 





代码 清单 8-6 方法 静态 分 派 演示 





package org.fenixsoft.polymorphic; 
大 大 


* 方法 静态 分 派 演示 

* @author zzm 

A 

public class StaticDispatch { 
static abstract class Human { 


static class Man extends Human { 

. 

static class Women extends Human { 

} 

public void sayHello (Human guy) { 
System.out .println ("hello, guy!"); 

} 

public void sayHello (Man guy) { 
System.out.println ("hello, gentleman!"); 

: 

Public void sayHello (Women guy) { 
System.out .println ("hello, lady!"); 

} 

public static void main (String[] args) { 
Human man = new Man(); 
Human women = new Women () 7 
StaticResolution sr = new StaticResolution(); 
sr.sayHello (man); 
sr.sayHello (women); 


hello, guy! 
hello, guy! 











代码 清单 8-6 中 的 代码 实际 上 是 在 考察 阅读 者 对 重 载 的 理解 程度 ， 相 信 对 Java 稍 有 经 验 的 程序 员 看 完 程序 后 都 能 得 出 正确 的 运行 结果 ， 但 为 什么 会 选择 执行 参数 类 型 为 Human 的 重 载 呢 ? 在 解决 这 个 问 
题 之 前 ， 我 们 先 按 如 下 代码 定义 两 个 重要 的 概念 : 














Human man = new Man(); 


我 们 把 上 面 代码 中 的 “Human” 称 为 变量 的 静态 类 型 (Static Type) 或 者 外 观 类 型 (Apparent Type) ， 后 面 的 “Man” 则 称 为 变量 的 实际 类 型 (Actual Type) ， 静 态 类 型 和 实际 类 型 在 程序 中 都 可 
以 发 生 一 些 变化 ， 区 别 是 静态 类 型 的 变化 仅仅 在 使 用 时 发 生 ， 变 量 本 身 的 静态 类 型 不 会 被 改变 ， 并 且 最 终 的 静态 类 型 是 在 编译 期 可 知 的 ; 而 实际 类 型 变化 的 结果 在 运行 期 才 可 确定 ， 编 译 器 在 编译 程序 的 时 
候 并 不 知道 一 个 对 象 的 实际 类 型 是 什么 。 如 下 面 的 代码 : 






































// 实际 类 型 变化 
Human man = new Man(); 
man = new Women () 7 

// 静态 类 型 变化 
sr.sayHello( (Man) man) 
Sr.SayHel1lo ( (Women) man) 












































解释 了 这 两 个 概念 ， 再 回 到 代码 清单 8-6 的 样 例 代码 中 。main() 里 面 的 两 次 sayHello() 方 法 调用 ， 在 方法 接收 者 已 经 确定 是 对 象 “sr” 的 前 提 下 ， 使 用 哪个 重 载 版 本 ， 就 完全 取决 于 传 入 参数 的 数量 和 数 
据 类 型 。 代 码 中 刻意 地 定义 了 两 个 静态 类 型 相同 、 实 际 类 型 不 同 的 变量 ， 但 虚拟 机 (准确 地 说 是 编译 器 ) 在 重 载 时 是 通过 参数 的 静态 类 型 而 不 是 实际 类 型 作为 判定 依据 的 。 并 和 且 静态 类 型 是 编译 期 可 知 的 ， 
所 以 在 编译 阶段 ，Javac 编 译 器 就 根据 参数 的 静态 类 型 决定 使 用 哪个 重 载 版 本 ， 所 以 选择 了 sayHello(Human) 作 为 调用 目标 ， 并 把 这 个 方法 的 符号 引用 写 到 main() 方 法 里 的 两 条 invokevirtual 指 令 的 参数 中 。 




















































































































所 有 依赖 静态 类 型 来 定位 方法 执行 版 本 的 分 派 动作 ， 都 称 为 静态 分 派 。 静 态 分 派 的 最 典型 应 用 就 是 方法 重 载 。 静 态 分 派发 生 在 编译 阶段 ， 因 此 确定 静态 分 派 的 动作 实际 上 不 是 由 虚拟 机 来 执行 的 。 另 
外 ， 编 译 器 虽然 能 确定 出 方法 的 重 载 版 本 ， 但 在 很 多 情况 下 这 个 重 载 版 本 并 不 是 “唯一 的 ”， 往 往 只 能 确定 一 个 “更 加 合适 的 ”版 本 。 这 种 模糊 的 结论 在 由 0 和 1 构成 的 计算 机 世界 中 算是 个 比较 “稀罕 ”的 
事件 ， 产 生 这 种 模糊 结论 的 主要 原因 是 字面 量 不 需要 定义 ， 所 以 字面 量 没有 显 式 的 静态 类 型 ， 它 的 静态 类 型 只 能 通过 语言 上 的 规则 去 理解 和 推断 。 代 码 清单 8- 7 演示 了 何 为 “更 加 合适 的 ”版 本 。 



















































































代码 清单 8-7。 重 载 方法 匹配 优先 级 

















Package org.fenixsoft.polymorphic; 
Public class Overload { 
public static void sayHello(Object arg) { 
System.out .Println("hel1lo Object") 
} 
public static void sayHello(int arg) { 
System.out.println("hello int"); 


} 

public static void sayHello(long arg) { 
System.out.println("hello long"); 

: 

Public static void sayHello(Character arg) { 
System.out.println ("hello Character"); 


} 

public static void sayHello(char arg) { 
System.out.println ("hello char"); 

1 

public static void sayHello (charhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... arg) { 
System.out .printlin ("hello char http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/..."); 


} 

Public static void sayHello(Serializable arg) { 
System.out.println("hello Serializable"); 

public static void main(String[] args) { 
sayHello('a'); 

} 





上 面 的 代码 运行 后 会 输出 : 





hello char 





这 很 好 理解 ，'a' 是 一 个 char 类 型 的 数据 ， 自 然 会 寻找 参数 类 型 为 char 的 重 载 方 法 ， 如 果 注 释 掉 sayHello(char arg) 方 法 ， 那 么 输出 会 变 为 : 





hello int 











这 时 发 生 了 一 次 自动 类 型 转换 ，'a 除了 可 以 代表 一 个 字符 串 外 ， 还 可 以 代表 数字 65 (字符 'a 的 Unicode 数 值 为 十 进 制 数字 65) ， 因 此 参数 类 型 为 int 的 重 载 也 是 合适 的 。 我 们 继续 注释 掉 sayHello(int 














及 
半 
这 


arg) 方 法 ， 那 么 输 ! 


hello long 








这 时 发 生 了 两 次 





还 能 继续 发 生 多 次 ， 按 照 char 一 int 一 long 一 float 一 double 的 顺序 转型 进行 匹配 。 但 不 会 匹配 到 byte 和 short 类 型 的 宣 


法 ， 那 么 输出 会 变 为 : 


hello Character 


这 时 发 生 了 一 次 自动 装 箱 ，'a' 被 包装 为 它 的 封装 类 型 java.lang.Character， 所 以 





hello Serializable 








这 个 输出 可 能 会 让 人 感觉 摸 不 着 头脑 ， 一 个 字符 或 数字 与 序列 化 有 什么 关系 ? 出 现 hello Serializable， 是 
自动 转型 。char 可 以 转型 成 int， 但 是 Character 是 绝对 不 会 转型 为 Integer 的 ， 
ble 和 Comparable<Character> 的 重 载 方法 ， 那 么 它们 此 时 的 优先 级 是 一 样 的 。 编 译 器 无 法 


类 型 ， 所 以 紧 接 着 又 发 生 一 次 


java.lang.Comparable<Character> ， 如 果 


找 不 到 装 箱 类 ， 但 是 找到 了 装 箱 类 实现 了 的 接口 
Character 还 实现 了 另外 一 个 接 




















匹配 到 了 参数 类 型 为 Character 的 了 





同时 出 现 两 个 参数 分 别 为 Serializa 























确定 要 自动 转型 为 哪 种 类 型 ， 会 提示 类 型 模糊 ， 拒 绝 编译 。 程 序 必须 在 调 
sayHello(Serializable arg) 方 法 ， 输 出 会 变 为 : 





hello Object 


这 时 是 char 装 箱 后 转型 为 父 类 了 ， 如 果 有 多 个 父 类 ， 那 么 将 在 继承 关系 中 从 下 往 上 开始 搜索 ， 越 接近 上 层 的 优先 级 越 低 。 即 使 方法 调 有 


sayHello(Object arg) 也 注释 掉 ， 输 出 将 会 变 为 : 


时 显 式 地 指定 字 





自动 类 型 转换 ，'a 转换 为 整数 65 之 后 ， 进 一 步 转换 为 长 整数 65L， 匹 配 了 参数 类 型 为 long 的 重 载 。 笔 者 在 代码 中 没有 编写 其 他 类 型 (如 float、double 等 ) 的 重 载 ， 不 过 实际 上 自动 转型 











载 ， 


因为 char 到 byte 或 short 的 转型 是 不 安全 的 。 我 们 继续 注释 掉 sayHello(long arg) 方 

















因 











面 量 的 静态 类 型 ， 如 sayHello((Comparable<Character>)'a')， 才 能 通过 编译 。 下 


为 java.lang.Serializable 是 java.lang.Character 类 实现 的 一 个 接 


EE 载 ， 继 续 注释 掉 sayHello(Character arg) 方 法 ， 那 么 输出 会 变 为 : 





口 ， 自 动 装 箱 之 后 发 现 还 是 
或 父 类 。 








它 只 能 安全 地 转型 为 它 实 现 的 接 














H| 





继续 注释 掉 





























传 入 的 参数 值 为 null， 这 个 规则 仍然 适用 。 我 们 把 














hello char http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 




















七 个 重 载 方法 已 经 被 注释 得 只 剩 一 个 了 ， 可 见 变 长 参数 的 重 载 优先 级 是 最 低 的 ， 这 时 候 字符 'a' 被 当 作 了 一 个 数组 元 素 。 笔 者 使 F 














的 变 长 参数 重 载 来 把 上 面 





Character 类 型 、Object 类 型 等 











的 过 程 重新 演示 一 遍 。 但 是 要 注意 的 是 ， 有 一 些 在 和 

















的 是 char 类 型 的 变 长 参数 ， 读 者 在 验证 时 还 可 以 选择 int 类 型 、 








个 参数 中 能 成 立 的 自动 转型 ， 如 char 转 型 为 int， 在 变 长 参数 中 是 不 成 立 的 内 。 





























代码 清单 8-7 演 示 了 编译 期 间 选 择 静态 分 派 目标 的 过 程 ， 这 个 过 程 也 是 Java 语 言 实现 方法 名 
于 讲解 重 载 时 目标 方法 选择 的 过 程 ， 大 部 分 情况 下 进行 这 样 极端 的 
































能 笔者 拿 来 做 演示 仅仅 是 
中 写 如 此 极端 的 重 载 代码 。 




















另外 还 有 一 点 读者 可 能 比较 容易 混淆 : 笔者 讲述 的 解析 与 分 派 这 两 者 之 间 的 关系 并 不 是 二 选 一 的 











载 的 本 质 。 演 示 所 
重 载 都 可 算 作 真正 的 “ 奇 技 ”。 无 论 对 重 载 的 认识 有 多 么 深刻 ， 一 个 合格 的 程序 员 都 不 应 该 在 实际 应 











就 进行 解析 ， 而 静态 方法 显然 也 是 可 以 拥有 重 载 版 本 的 ， 选 择 重 载 版 本 的 过 程 是 通过 静态 分 派 完 成 的 。 








2 动态 分 派 

















了 解 了 静态 分 派 ， 我 们 接 下 来 看 一 下 动态 分 派 的 过 程 ， 它 和 多 态 性 的 另外 一 个 
分 派 ， 请 看 代码 清单 8-8 中 所 示 的 代码 。 





代码 清单 8-8 方法 动态 分 派 演 示 


package org.fenixsoft.polymorphic; 
大 大 


* 方法 动态 分 派 演示 
* @author zzm 
证 
Public class DynamicDispatch { 
static abstract class Human { 
protected abstract void sayHello(); 


static class Man extends Human { 
QOverride 
protected void sayHello() { 
System.out .Println("man say hello"); 
是 
于 
static class Women extends Human { 
QOverride 
protected void sayHello() { 
System.out .Println("women say hello"); 
} 
} 
public static void main (String[] args) { 
Human man = new Man(); 
Human women = new Women () 7 
man.sayHello(); 
women.sayHello (); 
man = new Women () 7 
man.sayHello(); 


man say hello 
women say hello 
women say hello 





这 个 运行 结果 相信 不 会 出 平 任何 人 的 意料 ， 习 惯 了 





显然 这 里 是 不 可 能 根据 静态 类 型 来 决定 的 ， 
现象 的 原因 很 明显 ， 是 这 两 个 变量 的 实际 类 型 不 




















代码 清单 8-9 main() 方 法 的 字 节 码 





重 写 (Override) 有 着 很 密切 的 关联 。 我 们 还 是 上 





要 体现 Pl 


因为 静态 类 型 都 是 Human 的 两 个 变量 man 和 women 在 调 有 
同 ，Java 虚 拟 机 是 如 何 根据 实际 类 型 来 分 派 方法 执行 版 本 的 


面向 对 象 思维 的 Java 程 序 员 会 觉得 这 是 完全 理所当然 的 。 我 们 现在 的 问题 还 是 和 前 面 的 一 样 ， 虚 拟 机 是 如 何 知道 要 调 

















尼 ? 我 们 使 


的 这 段 程序 


# 他 关系 ， 它 们 是 在 不 同 


sayHello() 方 法 时 执行 了 不 同 





面试 题 为 难 求职 者 之 外 ， 在 实际 工作 中 几乎 不 可 








作 











属于 很 极端 的 例子 ， 除 了 



































层次 上 去 筛选 和 确定 目标 方法 的 过 程 。 例 如 ， 前 面 说 过 静态 方法 会 在 类 加 载 期 














前 面 的 Man 和 Women 一 起 sayHello 的 例子 来 讲解 动态 




















哪个 方法 的 ? 














的 行为 ， 并 且 变 量 man 在 两 次 调用 中 执行 了 不 同 的 方法 。 导 致 这 个 














javap 命 令 输出 这 段 代 码 的 字 节 码 ， 结 果 如 代码 清单 8-9 所 示 : 











public static void main (java.lang.String[])7 


Code: 
Stack=2, Locals=3, Args size=1 


0: new #16; //class 
org/fenixsoft/polymorphic/DynamicDispatch$Man 
dup 
4: invokespecial #18; //Method 


org/fenixsoft/polymorphic/DynamicDispatch$Man."<init>": ()V 


astore 1 


8: new #19; //class 


org/fenixsoft/polymorphic/DynamicDispatch$Women 


11: dup 


12: invokespecial //Method 


#21; 


org/fenixsoft/polymorphic/DynamicDispatch$Women 


15: astore 2 
16: aload 1 


17: invokevirtual #22; //Method 


org/fenixsoft/polymorphic/DynamicDispatch$Human 


20: aload 2 


21: :invokevirtual #22; //Method 


org/fenixsoft/polymorphic/DynamicDispatch$Human 


24: new #19; //class 


org/fenixsoft/polymorphic/DynamicDispatch$Women 


dup 
28: invokespecial #21; //Method 


org/fenixsoft/polymorphic/DynamicDispatch$Women 


31: astore 1 
32: aload 1 


33: jinvokevirtual #22; //Method 


org/fenixsoft/polymorphic/DynamicDispatch$Human 


return 





0~15 行 的 字 节 码 是 准备 动作 ， 作 用 是 建立 man 和 women 的 内 存 空间 、 调 


这 两 句 : 


Human man = new Man(); 
Human women = new Women () 7 


SCREEN 
.sayHello: ()V 
.sayHello: ()V 
a ni 
.SayHello: ()V 

















Man 和 Women 类 型 的 实例 构造 器 ， 将 这 两 个 实例 的 引 


























存放 在 第 1 和 第 2 个 局 部 变量 表 Slot 之 中 ， 这 个 动作 对 应 了 代码 中 的 





接 下 来 的 第 16~21 行 是 关键 部 分 ， 第 16 和 第 20 两 行 分 别 把 刚刚 创建 的 两 个 对 象 的 引 























压 到 栈 顶 ， 这 两 个 对 象 是 将 要 执行 的 sayHello() 方 法 的 所 有 者 ， 称 为 接收 者 (Receiver) ; 第 17 和 第 21 两 行 是 方法 








) 都 完全 一 样 ， 但 是 这 

















， 注 释 显示 了 这 个 常量 是 Human.sayHello0 的 符号 引 | 


























调用 指令 ， 单 从 字 节 码 的 角度 来 看 ， 这 两 条 调 
两 条 指令 最 终 执行 的 目标 方法 并 不 相同 ， 其 原 




















1) 找到 操作 数 栈 顶 的 第 一 个 元 素 所 指向 的 


2) 如 果 在 类 型 C 中 找到 与 常量 中 的 描述 符 和 简单 名 称 都 相符 的 方法 ， 则 进行 访问 权限 校 验 ， 如 果 通 过 则 返 





旨 令 无 论 是 指令 (都 是 invokevirtual) 还 是 参数 (都 是 常 





对 象 的 实际 类 型 ， 记 作 C。 


池 中 第 22 项 的 常 
因 需 要 从 invokevirtual 指 令 的 多 态 查找 过 程 开 始 说 起 ，invokevirtual 指 令 的 运行 时 解析 过 程 大 致 分 为 以 下 步骤 : 

















可 这 个 方法 的 直接 引 














， 查 找 过 程 结束 ; 不 通过 则 返回 java.lang.lllegalAccessError 异 常 。 





























3) 否则 ， 按 照 继承 关系 从 下 往 上 依次 对 C 的 各 个 父 类 进行 第 2 步 的 搜索 和 验证 过 程 。 


4) 如 果 始 终 没有 找到 合适 的 方法 ， 则 抛 出 java.lang.AbstractMethodError 异 常 。 


由 于 invokevirtual 指 令 : 


法 








3. 单 分 派 与 多 分 派 


方法 的 接收 者 与 方法 的 参数 统称 为 方法 的 





行 的 第 一 步 就 是 在 运行 期 确定 接收 者 的 实际 类 型 ， 所 以 两 次 调 有 
的 本 质 。 我 们 把 这 种 在 运行 期 根据 实际 类 型 确定 方法 执行 版 本 的 分 派 过 程 称 为 动态 分 派 。 























宗 量 ， 这 个 定义 最 早 应 该 来 源 于 《Java 与 模式 》 一 书 的 译文 。 根 拉 


标 方法 进行 选择 ， 多 分 派 则 是 根据 多 于 一 个 的 宗 量 对 目标 方法 进行 选择 。 











代码 清单 83-10” 单 分 派 和 多 分 派 





中 的 invokevirtual 指 令 把 常量 池 中 的 类 方法 符号 引 








上 ， 这 个 过 程 就 是 Java 语 言 中 方 











解析 到 了 不 同 的 直接 引 























个 宇 昌 : 











居 分 派 基 于 多 少 种 宗 量 ， 可 以 将 分 派 划分 为 单 分 派 和 多 分 派 两 种 。 单 分 派 是 根据 一 个 宗 量 对 目 


单 分 派 和 多 分 派 的 定义 相当 捅 口 ， 不 过 对 照 着 实例 看 就 不 难 理解 了 ， 代 码 清单 8-10 中 列举 了 一 个 Father 和 Son 一 起 来 做 出 “一 个 艰难 的 决定 ”的 例子 。 





大 
* 单 分 派 、 多 分 派 演示 
* Q@author zzm 
wd 
public class Dispatch { 
static class QQ {} 
static class 360 {} 
public static class Father { 
Public void hardChoice (QQ arg) { 


System.out .Println("father choose qq"); 


public void hardChoice( 360 arg) 


{ 


System.out .println ("father choose 360"); 


} 
. 


public static class Son extends Father { 
public void hardChoice (QQ arg) { 
System.out.println ("son choose qq"); 


} 
public void hardChoice( 360 arg) { 
System.out .Println ("son choose 360"); 


. 

public static void main (String[ 
Father father = new Father( 
Father son = new Son(); 
father.hardChoice (new 360( 
son.hardChoice (new QQ ()) 7 


] args) { 
) 7 


) ) 7 








father choose 360 
son choose qq 























= 


了 两 次 hardChoice() 方 法 ， 这 两 次 hardChoice() 方 法 的 选择 结果 在 程序 输出 中 已 经 显示 得 很 清楚 了 。 














在 main 函 数 中 调 
再 来 看 看 编译 阶段 编译 器 的 选择 过 程 ， 即 静态 分 派 的 过 程 。 这 时 候选 择 目标 方法 的 依据 有 两 点 : 一 是 静态 类 型 是 Father 还 是 Son， 二 是 方法 参数 是 QQ 还 是 360。 这 次 选择 结果 的 最 终 产 物 是 产生 了 两 条 
。 因为 是 根据 两 个 宗 量 进 行 选择 ， 所 以 Java 语 言 的 静态 分 派 属 于 多 分 派 类 型 。 


invokevirtual 指 令 ， 两 条 指令 的 参数 分 别 为 常量 池 中 指向 Father.hardChoice(360) 及 Father.hardChoice(QQ) 方 法 的 符号 引 





再 看 看 运行 阶段 虚拟 机 的 选择 ， 即 动态 分 派 的 过 程 。 在 执行 “son.hardChoice(new QQ0)” 这 句 代码 时 ， 更 准确 地 说 ， 在 执 


签名 必须 为 hardChoice(QQ)， 虚 拟 机 此 时 不 会 关心 传递 过 来 的 参数 “QQ” 到 底 是 “腾讯 QQ” 还 是 “奇瑞 QQ”， 

















行 这 句 代码 所 对 应 的 invokevirtual 指 令 时 ， 由 于 编译 期 已 经 决定 目标 方法 的 
因为 这 时 候 参数 的 静态 类 型 、 实 际 类 型 都 不 会 对 方法 的 选择 构成 任何 影响 ， 唯 一 可 以 影响 





虚拟 机 选择 的 因素 只 有 此 方法 的 接收 者 的 实际 类 型 是 Father 还 是 Son。 因 为 只 有 一 个 宗 量 作为 选择 依据 ， 所 以 Java 语 言 的 动态 分 派 属于 单 分 派 类 型 。 




















根据 上 述 论 证 的 结果 ， 我 们 可 以 总 结 如 下 : 今天 (JDK 1.6 时 期 ) 的 Java 语 言 是 一 门 静 态 多 分 派 、 动 态 单 分 派 的 语言 。 强 调 “今天 的 Java 语 言 ”是 因为 这 个 结论 未 必 会 恒久 不 变 ，C# 在 3.0 及 之 前 的 版 本 











与 java 一样 是 动态 单 分 派 语言 ， 但 在 C#4.0 中 引入 了 dynamic 类 型 后 ， 就 可 以 很 方便 地 实现 动态 多 分 派 。Java 也 已 经 在 JSR-292[6 中 开始 规划 对 动态 语言 的 支持 了 ， 日 后 将 有 可 能 提供 类 似 的 动态 类 型 功能 。 











4 .虚拟 机 动态 分 派 的 实现 








前 面 介 绍 的 分 派 过 程 ， 作 为 对 虚拟 机 概念 模型 的 解析 基本 上 已 经 足够 了 ， 它 已 经 解决 了 虚拟 机 在 分 派 中 “会 做 什么 ”这 个 问题 。 但 是 虚拟 机 “具体 是 如 何 做 到 的 ” ， 可 能 各 种 虚拟 机 的 实现 都 会 有 所 差 





由 于 动态 分 派 是 非常 频繁 的 动作 ， 而 且 动 态 分 派 的 方法 版 本 选择 过 程 需要 运行 时 在 类 的 方法 元 数据 中 搜索 合适 的 目标 方法 ， 因 此 在 虚拟 机 的 实际 实现 中 基于 性 能 的 考虑 ， 大 部 分 实现 都 不 会 真 的 进行 如 
此 频繁 的 搜索 。 面 对 这 种 情况 ， 最 常用 的 “稳定 优化 ”手段 就 是 为 类 在 方法 区 中 建立 一 个 虚 方法 表 (Virtual Method Table， 也 称 为 vtable， 与 此 对 应 ， 在 invokeinterface 执 行 时 也 会 用 到 接口 方法 表 一 一 
Interface Method Table， 简 称 itable) ， 使 用 虚 方 法 表 索 引 来 代 蔡 元 数据 查找 以 提高 性 能 。 我 们 先 看 看 代码 清单 8-10 所 对 应 的 虚 方法 表 结构 示例 ， 如 图 8-3 所 示 。 















































Father 方 法 表 son 方法 表 
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图 8-3 方法 表 结 构 

















虚 方 法 表 中 存放 着 各 个 方法 的 实际 入 口 地 址 。 如 果 某 个 方法 在 子 类 中 没有 被 重 写 ， 那 么 子 类 的 虚 方法 表 里 面 的 地 址 入 口 和 父 类 相同 方法 的 地 址 入 口 是 一 致 的 ， 都 指向 父 类 的 实现 入 口 。 如 果子 类 中 重 写 
了 这 个 方法 ， 子 类 方法 表 中 的 地 址 将 会 被 替换 为 指向 子 类 实现 版 本 的 入 口 地 址 。 图 8-3 中 ，Son 重 写 了 来 自 Father 的 全 部 方法 ， 因 此 son 的 方法 表 没 有 指向 Father 类 型 数据 的 箭头 。 但 是 yon 和 Father 都 没有 
重 写 来 自 Object 的 方法 ， 所 以 它们 的 方法 表 中 所 有 从 Object 继承 来 的 方法 都 指向 了 Object 的 数据 类 型 。 
























































为 了 程序 实现 上 的 方便 ， 具 有 相同 签名 的 方法 ， 在 父 类 、 子 类 的 虚 方法 表 中 都 应 当 具 有 一 样 的 索引 序号 ， 这 样 当 类 型 变换 时 ， 仪 需要 变更 查找 的 方法 表 ， 就 可 以 从 不 同 的 虚 方法 表 中 按 索引 转换 出 所 需 
的 入 口 地 址 。 





方法 表 一 般 在 类 加 载 的 连接 阶段 进行 初始 化 ， 准 备 了 类 的 变量 初始 值 后 ， 虚 拟 机 会 把 该 类 的 方法 表 也 初始 化 完毕 。 





























上 文中 笔者 说 方法 表 是 分 派 调用 的 “稳定 优化 ”手段 ， 虚 拟 机 除了 使 用 方法 表 之 外 ， 在 条 件 允 许 的 情况 下 ， 还 会 使 用 内 联 缓存 (Inline Cache) 和 基于 “类 型 继承 关系 分 析 ” (Class Hierarchy 
Analysis，CHA) 技术 的 守护 内 联 (Guarded Inlining) 两 种 非 稳定 的 “激进 优化 ”手段 来 获得 更 高 的 性 能 ， 关 于 这 两 种 优化 技术 的 原理 和 运作 过 程 ， 读 者 可 以 参考 本 书 第 11 章 中 的 相关 内 容 。 











1] JSR-292 中 引入 了 第 5 条 新 的 字 节 码 指令 invokedynamic 以 及 新 的 javalanginvoke (未 稳定 前 巴 javadyn) 包 实 现 对 动态 语言 的 支持 ， 这 些 特性 有 望 在 JDK 1.7 中 正式 提供 ， 本 文 暂 以 现 有 的 JDK 1.6 为 基础 进行 
阐述 。 

2] 这 里 涉及 的 分 派 的 相关 概念 (如 “ 宗 量 ”等 ) 在 后 文中 会 有 所 解释 。 

3] 严格 来 说 ，“Dispatch” 这 个 词 一 般 不 用 在 静态 环境 中 ， 英文 技术 文档 的 称呼 是 “Method Overload Resolution”， 但 国内 的 各 种 资料 都 普遍 将 这 种 行为 称 为 “静态 分 派 ”， 特 此 说 明 。 

4] 重 载 中 选择 最 合适 方法 的 过 程 ， 可 参见 Java 语言 规范 的 $ 15.12.2.5 Choosing the Most Specific Method 章 节 。 

5] 有 一 种 观点 认为 : 因为 重 载 是 静态 的 ， 重 写 是 动态 的 ， 所 以 只 有 重 写 算是 多 态 性 的 体现 ， 而 重 载 不 算 多 态 。 笔 者 认为 这 种 争论 没有 意义 ， 概 念 仅仅 是 说 明 问 题 的 一 种 工具 。 

6] JSR-292 : Supporting Dynamically Typed Languages on the Java Platform (Java 平台 的 动态 语言 支持 ) 。 








8.4 ”基于 栈 的 字 节 码 解 释 执 行 引 擎 














关于 虚拟 机 是 如 何 调用 方法 已 经 讲解 完毕 ， 从 本 节 开 始 ， 我 们 来 探讨 虚拟 机 是 如 何 执行 方法 里 面 的 字 节 码 指令 的 。 概 述 中 提 到 过 ， 许 多 Java 虚 拟 机 的 执行 引擎 在 执行 Java 代 码 的 时 候 都 有 解释 执行 ( 通 


过 解释 器 执行 ) 和 编译 执行 (通过 即时 编译 器 产生 本 地 代码 执行 》 两 种 选择 ， 下 面 我 们 先 来 探讨 一 下 在 解释 执行 时 虚拟 机 执行 引擎 是 如 何 工作 的 。 








8.4.1 解释 执行 


Java 语 言 经 常 被 人 们 定位 为 “解释 执行 ”的 语言 ， 在 Java 初 生 的 JDK 1.0 时 代 ， 这 种 定义 还 算是 比较 准确 的 ， 但 当主 流 的 虚拟 机 中 都 包含 了 即时 编译 器 后 ，Class 文 件 中 的 代码 到 底 会 被 解释 执行 还 是 编 
译 执行 ， 就 成 了 只 有 虚拟 机 自己 才能 准确 判断 的 事 。 再 后 来 ，Java 发 展 出 了 可 以 直接 生成 本 地 代码 的 编译 器 (如 GCJI]，GNU Compiler for the Java) ， 而 C/C++ 语 言 也 出 现 了 通过 解释 器 执行 的 版 本 


(如 CINT[ 外 ) ， 这 时 候 再 笼统 地 说 “解释 执行 ”对 于 整个 Java 语 言 来 说 几乎 就 是 没有 意义 的 概念 了 ， 只 有 确定 了 谈论 对 象 是 某 种 具体 的 Java 实 现 版 本 和 执行 引擎 运行 模式 时 ， 谈 解释 执行 还 是 编译 执行 才 会 
比较 确切 。 
























































不 论 是 解释 还 是 编译 ， 也 不 论 是 物理 机 还 是 虚拟 机 ， 对 于 应 用 程序 ， 机 器 都 不 可 能 如 人 那样 阅读 和 理解 ， 然 后 就 获得 了 执行 能 力 。 大 部 分 的 程序 代码 到 物理 机 的 目标 代码 或 虚拟 机 能 执行 的 指令 集 之 
前 ， 都 需要 经 过 图 8-4 中 的 各 个 步 又。 如果 读者 对 大 学 编译 原理 的 相关 课程 还 有 印象 的 话 ， 很 容易 就 会 发 现 图 中 下 面 的 那 条 分 支 ， 就 是 传统 编译 原理 中 程序 代码 到 目标 机 器 代码 的 生成 过 程 ， 而 中 间 的 那 条 分 
支 自然 就 是 解释 执行 的 过 程 。 























程序 源码 | 攻 词法 分 析 | 语法 分 析 
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解释 执行 加 解释 絮 指令 流 ( 可 选 ) | 抽象 语法 树 











目标 代码 本 生成 器 J 中 间 民 码 ( 可 选 ) J 已 化 器 5 可 选 ) 


图 8-4 ”编译 过 程 








如 今 ， 基 于 物理 机 、Java 虚 拟 机 或 者 是 非 Java 的 其 他 高 级 语言 虚拟 机 (HLLVM) 的 语言 ， 大 多 都 遵循 这 种 基于 现代 经 典 编译 原理 的 思路 ， 在 执行 前 先 对 程序 源码 进行 词法 分 析 和 语法 分 析 处 理 ， 把 源码 
转化 为 抽象 语法 树 (Abstract Syntax Tree，AST) 。 对 于 一 门 具体 语言 的 实现 来 说 ， 词 法 和 语法 分 析 乃 至 后 面 的 优化 器 和 目标 代码 生成 器 都 可 以 选择 独立 于 执行 引擎 ， 形 成 一 个 完整 意义 的 编译 器 去 实现 ， 
这 类 代表 是 C/C++ 语言 。 也 可 以 选择 把 其 中 一 部 分 步骤 (如 生成 抽象 语法 树 之 前 的 步骤 ) 实现 为 一 个 半 独 立 的 编译 器 ， 这 类 代表 是 Java 语 言 。 又 或 者 把 这 些 步 骤 和 执行 引擎 全 部 集中 封装 在 一 个 封闭 的 黑 匣 
子 之 中 ， 如 大 多 数 的 Javascript 执 行 器 。 




















Java 语 言 中 ，Javac 编 译 器 完成 了 程序 代码 经 过 词法 分 析 、 语 法 分 析 到 抽象 语法 树 ， 再 遍历 语法 树 生成 线性 的 字 节 码 指令 流 的 过 程 。 因 为 这 一 部 分 动作 是 在 Java 虚 拟 机 之 外 进行 的 ， 而 解释 器 在 虚拟 机 的 
内 部 ， 所 以 Java 程 序 的 编译 就 是 半 独 立 的 实现 。 








8.4.2 ”基于 栈 的 指令 集 与 基于 寄存 器 的 指令 : 

















Java 编 译 器 输出 的 指令 流 ， 基 本 上 是 一 种 基于 栈 的 指令 集 架构 (Instruction Set Architecture，ISA) ， 指 令 流 里 面 的 指令 大 部 分 都 是 零 地址 指令 ， 它 们 依赖 操作 数 栈 进行 工作 。 与 之 相对 的 另外 一 套 
常用 的 指令 集 架构 是 基于 寄存 器 的 指令 集 ， 最 典型 的 就 是 x86 的 二 地 址 指令 集 ， 更 通俗 一 些 ， 就 是 现在 我 们 主流 PC 中 直接 支持 的 指令 集 架 构 ， 这 些 指令 依赖 寄存 器 进行 工作 。 那 么 ， 基 于 栈 的 指令 集 与 基于 
寄存 器 的 指令 集 这 两 者 之 间 有 什么 不 同 呢 ? 
























































举 个 最 简单 的 例子 ， 分 别 使 用 这 两 种 指令 集 去 计算 “1+1” 的 结果 ， 基 于 栈 的 指令 集会 是 这 样子 的 : 





iconst 1 
iconst 1 
iadd 

istore 0 





两 条 iconst_1 指 令 连 续 地 把 两 个 常量 1 压 入 栈 后 ，iadd 指 令 把 栈 项 的 两 个 值 出 栈 并 相 加 ， 然 后 把 结果 放 回 栈 顶 ， 最 后 istore_0 把 栈 顶 的 值 放 到 局 部 变量 表 的 第 0 个 Slot 中 。 


如 果 是 基于 寄存 器 的 指令 集 ， 那 么 程序 可 能 会 是 这 个 样子 的 : 


mov eax, 1 
add eax, 1 














mov 指 令 把 EAX 寄存 器 的 值 设 为 1， 然 后 add 指 令 再 把 这 个 值 加 1， 结 果 就 保存 在 EAX 寄存 器 里 面 。 


了 解 了 基于 栈 的 指令 集 与 基于 寄存 器 的 指令 集 的 区 别 





四 


读者 可 能 会 有 进一步 的 疑问 ， 这 两 套 指令 集 谁 更 好 一 些 呢 ? 








应 该 说 ， 既 然 两 套 指令 集 同时 并 存 和 发 展 ， 那 么 肯定 是 各 有 优势 的 ， 如 果 有 一 套 指令 集 全 面 优 于 另外 一 套 的 话 ， 就 不 存在 选择 的 问题 。 





基于 栈 的 指令 集 最 主要 的 优点 就 是 可 移植 性 ， 寡 存 器 由 硬件 直接 提供 内 ， 程 序 直接 依赖 这 些 硬件 寄存 器 则 不 可 避免 地 要 受到 硬件 的 约束 。 例 如 ， 现 在 32 位 x86 体 系 的 处 理 器 中 提供 了 8 个 32 位 的 寄存 器 ， 
而 ARM 体 系 的 CPU (在 当前 的 手机 、PDA 中 相当 流行 的 一 种 处 理 器 ) 则 提供 了 16 个 32 位 的 通用 寄存 器 。 如 果 使 用 栈 架 构 的 指令 集 ， 用 户 程序 不 会 直接 用 到 这 些 寄存 器 ， 那 就 可 以 由 虚拟 机 实现 来 自行 决定 
把 一 些 访问 最 频繁 的 数据 (程序 计数 器 、 栈 顶 缓存 等 ) 放 到 寄存 器 中 以 获取 尽量 好 的 性 能 ， 这 样 实现 起 来 也 更 加 简单 。 栈 架构 的 指令 集 还 有 一 些 其 他 优点 ， 如 代码 相对 更 紧凑 ( 字 节 码 中 每 个 字 节 就 对 应 一 

































































条 指令 ， 而 多 地 址 指令 集中 还 需要 存放 参数 ) 、 编 译 器 实现 更 加 简 生 


和 (不 需要 考虑 空间 分 配 的 问题 ， 所 需 空间 都 在 栈 上 操作 ) 等 。 





栈 架 构 指令 集 的 主要 缺点 是 执行 速度 相对 来 说 稍 慢 一 些 。 所 有 主 





栈 架构 指令 集 的 代码 虽然 紧凑 ， 但 是 完成 相 
频繁 的 内 存 访问 ， 相 对 于 处 理 器 来 说 ， 内 存 始 终 是 执行 速度 的 瓶颈 。 
题 的 方法 。 因 此 ， 由 于 指令 数量 和 内 存 访问 的 原 











8.4.3 ”基于 栈 的 解释 器 执行 过 程 


初步 的 理论 已 经 讲解 完了 ， 本 小 节 准 备 了 一 段 Java 代 码 ， 看 看 在 虚拟 机 中 实际 上 是 如 何 执行 的 。 前 面 曾经 举 过 一 个 计算 “1+1” 的 例子 ， 下 面 给 出 的 例子 涉及 的 是 四 则 运算 加 减 乘除 法 ， 如 代码 清和 


11 所 示 。 


代码 清单 8-11 ”一段 简 和 





a 的 算术 代码 





public int calc() { 


int a = 100; 
int b = 200; 
int c = 300; 
return (a + b) * ey 


} 








同 功能 所 需 的 指令 数量 一 般 会 比 寄存 器 架构 多 ， 








因为 出 栈 、 入 栈 操作 本 身 就 产生 了 相当 多 的 指令 。 更 寻 
尽管 虚拟 机 可 以 采取 栈 顶 缓存 的 手段 ， 把 最 常 





























因 ， 导 致 了 栈 架构 指令 集 的 执行 速度 相对 较 慢 。 











这 段 代码 从 Java 语 言 的 角度 没有 任何 评论 的 必 











， 直 接 使 








代码 清单 8-12 一 段 简单 的 算术 代码 的 字 节 码 表示 


public int calc(); 


Code : 

Stack=2, Locals=4, Args size=1 
Ds bipush 100 
2: istore 1 

3: sipush 200 
Bs istore 2 

7: sipush 300 
10: istore 3 
11: iload 工 

12: iload 2 

13: add 

14: iload 3 

15: imul 

16: ireturn 





javap 提 示 这 段 代 码 需要 深度 为 2 的 操作 数 栈 和 4 个 Slot 的 


首先 ， 执 行 偏 移 地 址 为 0 的 指令 ，bipush 指 令 














执行 偏 移 地 址 为 1 的 指令 ，istore_1 指 令 的 作 
量 a、b、< 赋 值 为 100、200、300。 这 四 条 指令 的 














示 略 过 。 








javap 命 令 看 看 它 的 字 节 码 指令 


局 部 变量 空间 ， 笔 者 就 根 


的 作用 是 将 单字 节 的 整 型 常量 值 (-128~127) 推 入 操作 数 栈 项 ， 


是 将 操作 数 栈 顶 的 整 型 值 出 栈 并 存放 到 第 1 个 


， 如 代码 清单 8-12 所 示 。 

















图 








居 这 些 信息 画 了 








8-5 至 图 








8-11 共 七 张 








片 ， 来 描述 代码 清和 














后 跟 一 个 参数 ， 指 明 推 送 的 常量 值 ， 这 是 


的 操作 映射 到 寄存 器 中 以 避免 直接 内 存 访问 ， 但 这 也 


8-12 执 行 过 程 中 的 代码 、 操 作 数 栈 和 











局 部 变量 Slot 中 。 后 续 四 














有 是 100。 


条 指令 (直到 偏 移 为 11 的 指令 为 止 ) 都 是 做 同样 的 


要 的 是 栈 实现 在 内 存 之 中 ， 频 繁 的 栈 访问 也 就 意味 着 
只 能 是 优化 措施 而 不 是 解决 本 质问 








局 部 变量 表 的 变化 情 





情 ， 也 就 是 在 对 应 代码 中 把 变 


起 移 。 助 记 罕 程序 计数 如 


D0: bipush 100 


1store 1 


sipush 2zOD 


局 部 变量 表 


1store 2 
sipush 300 
LStore 3 
1load 1 
1load 2 
1add 
1]oad 3 
1mul 











图 8-5 ”执行 偏 移 地 址 为 0 的 指令 的 情况 








坊 乏 。 ” 助 记 入 生 序 计数 二 
0 birush 100 


sipush 200 
15tore 2 


sipush 300 


- 
日 
上 
和 
. 
. 
. 


Bb 
1store_3 
lload 1 
1load 2 
1add 
1load 3 
1mul 


lr eturi 











图 8-6 ”执行 偏 移 地 址 为 1 的 指令 的 情况 








执行 偏 移 地 址 为 11 的 指令 ，iload_1 指 令 的 作用 是 将 局 部 变量 表 第 1 个 Silot 中 的 整 型 值 复制 到 操作 数 栈 项 。 











执行 偏 移 地 址 为 12 的 指令 ，iload_2 指 令 的 执行 过 程 与 load_1 类 似 ， 把 第 2 个 Slot 的 整 型 值 入 栈 。 画 出 这 个 指令 的 图 示 主 要 是 为 了 显示 下 一 条 iadd 指 令 执行 前 的 堆栈 状况 。 











程序 计数 姨 
bipush 100 


1store 1 


sipush 200 局 部 变量 表 


1store 2 
sipush 300 
lstore 3 
ll: 1iload 1 

i1load 2 
1add 
i1load 3 
Im 


1return 











图 8-7 执行 偏 移 地 址 为 11 的 指令 的 情况 








偏 稀 助 记 符 程序 十 数 二 


bipush 100 


1store 1 


0 
2 
i sipush 200 
6b 
了 


1store 2 
sipush 300 
10: 1istore 3 
ll: 1iload 1 
12: 1load 2 
1add 
i1load 3 
imul 


1return 








图 8-8 ”执行 偏 移 地 址 为 12 的 指令 的 情况 








执行 偏 移 地 址 为 13 的 指令 ，iadd 指 令 的 作用 是 将 操作 数 栈 中 前 两 个 栈 顶 元 素 出 栈 ， 做 整 型 加 法 ， 然 后 把 结果 重新 入 栈 。 在 iadd 指 令 执 行 完毕 后 ， 栈 中 原 有 的 100 和 200 出 栈 ， 它 们 的 和 300 重 








新 入 栈 。 


吉 物 勒 记 符 三 序 十 数 盐 
bipush 100 


1store 1 


0 
此 
3: sipush UOD 
B 
了 


LStore 2 
sipush 300 
10: 1store 3 
ll: 11Load 1 
12: 1load 2 
13: 1add 
14: 1iload 3 
15: 1imul 


lB: 1ireturn 





图 8-9 ”执行 偏 移 地 址 为 13 的 指令 的 情况 


坑 物 有 助 记 符 程序 计数 姨 
bipush 100 


1store 1 


sipush 200 


局 部 变量 表 


1Sstore 2 
sipush 300 


1Store 3 


i1load 1 
i1load 2 
1add 


14: 11oad 3 


15: 1imul 


16: ireturn 





图 8-10 ”执行 偏 移 地 址 为 14 的 指令 的 情况 





执行 偏 移 地 址 为 14 的 指令 ，iload_3 指 令 把 存放 在 第 3 个 局 部 变量 Slot 中 的 300 入 栈 到 操作 数 栈 中 。 这 时 操作 数 栈 为 两 个 整数 300。 下 一 条 指令 imul 是 将 操作 数 栈 中 前 两 个 栈 顶 元 素 出 栈 ， 做 整 型 乘法 ， 然 
后 把 结果 重新 入 栈 ， 这 里 与 jadd 完 全 类 似 ， 所 以 笔者 省 略图 示 。 











执行 偏 移 地 址 为 16 的 指令 ，ireturn 指 令 是 方法 返回 指令 之 一 ， 它 将 结束 方法 执行 并 将 操作 数 栈 项 的 整 型 值 返回 给 此 方法 的 调用 者 。 到 此 为 止 ， 这 段 方法 执行 结束 。 


上 面 的 执行 过 程 仅仅 是 一 种 概念 异型， 虚拟 机 最 终 会 对 执行 过 程 做 出 一 些 优化 来 提高 性 能 ， 
因 是 虚拟 机 中 解析 器 和 即时 编译 器 都 会 对 输入 的 字 节 码 进行 优化 ， 例 如 ，HotSpot 虚 拟 机 中 就 有 很 多 以 “fast ”开头 的 非 标准 字 节 码 指令 
行 性 能 ， 即 时 编译 器 的 优化 手段 更 是 花样 繁多 中 ]。 


的 差距 ， 差 距 产生 的 原 





1 
13: 
14: 
a 


助 记 社 
bipush 100 


LStore 1 
sipush 200 
LStore 2 
sipush 300 
LSstore 3 
1load 1 
1load 2 
13add 
1load 3 
i1ml 





图 8-11 执行 偏 移 地 址 为 16 的 指令 的 情况 











实际 的 运作 过 程 不 一 定 完全 符合 概念 模型 的 描述 ， 更 准确 地 说 ， 实 际 情况 会 和 上 面 描述 的 概念 模型 有 非常 大 


于 合并 和 蔡 换 输入 的 字 节 码 以 提升 解释 执 





不 过 我 们 从 这 段 程序 的 执行 中 也 可 以 看 出 栈 结构 指令 集 的 一 般 运 行 过 程 ， 整 个 运算 过 程 的 中 间 变 量 都 以 操作 数 栈 的 出 栈 和 入 栈 为 信息 交换 途径 ， 符 合 我 们 在 前 面 分 析 的 特点 。 


[1] GCJ : http://gcc.gnu.org/java/。 


[2] CINT : http://root.cern.ch/drupal/content/cint。 


[3] 使 用 “基本 上 ”是 因为 部 分 字 节 码 指令 会 带 有 参数 ， 而 纯粹 基于 栈 的 指令 集 架构 中 应 当 全 部 都 是 零 地 址 指令 ， 也 就 是 不 存在 显 式 的 参数 。Java 这 样 实现 主要 是 考虑 了 代码 的 可 校 验 性 。 
团 这 里 说 的 是 物理 机 器 上 的 寄存 器 。 也 有 基于 寄存 器 的 虚拟 机 ， 如 Google Android 平台 的 Dalvik VM。 即 使 是 基于 寄存 器 的 虚拟 机 ， 也 会 希望 把 虚拟 机 寄存 器 尽量 映射 到 物理 寄存 器 上 以 获取 尽 可 能 高 的 性 


能 。 


加 ] 具体 可 以 参考 第 11 章 中 的 相关 内 容 。 


8.5 本章 小 结 


本 章 中 ， 我 们 分 析 了 虚拟 机 在 执行 代码 时 如 何 找到 正确 的 方法 ， 如 何 执行 方法 内 的 字 节 码 ， 以 及 执行 代码 时 涉及 的 内 存 结构 。 在 第 6、7、8 三 章 中 ， 我 们 针对 Java 程 序 是 如 何 存 储 的 、 如 何 载 入 ( 创 


建 ) 的 以 及 如 何 执行 的 问题 把 相关 知识 讲解 了 一 下 ， 下 一 章 我 们 将 一 起 看 看 这 些 理论 知识 在 具体 开发 中 的 经 典 应 用 。 





第 9 章 “类 加 载 及 执行 子 系统 的 案例 与 实战 














本 章 主要 内 容 


“概述 


“ 案例 分 析 


“ 实战 : 自己 动手 实现 远程 执行 功能 











代码 编译 的 结果 从 本 地 机 器 码 转 变 为 字 节 码 ， 是 存储 格式 发 展 的 一 小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


9.1 概述 














在 Class 文 件 格式 与 执行 引擎 这 部 分 里 ， 用 户 的 程序 能 直接 影响 的 内 容 并 不 太 多 ，Class 文 件 以 何 种 格式 存储 ， 类 型 何 时 加 载 、 如 何 连接 ， 以 及 虚拟 机 如 何 执行 字 节 码 指令 等 都 是 由 虚拟 机 直接 控制 的 行 
为 ， 用 户 程序 无 法 对 其 进行 改变 。 能 通过 程序 进行 操作 的 ， 主 要 是 字 节 码 生成 与 类 加 载 器 这 两 部 分 的 功能 ， 但 仅仅 在 如 何 处 理 这 两 点 上 ， 就 已 经 出 现 了 许多 值得 欣赏 和 借鉴 的 思路 ， 这 些 思路 后 来 成 为 了 许 
多 常用 功能 和 程序 实现 的 基础 。 在 本 章 中 ， 我 们 将 看 一 下 前 面 所 学 的 知识 在 实际 开发 之 中 是 如 何 应 用 的 。 


































































































9.2 ”案例 分 析 























在 案例 分 析 部 分 ， 笔 者 准备 了 四 个 例子 ， 关 于 类 加 载 器 和 字 节 码 的 案例 各 有 两 个 。 并 且 这 两 个 领域 的 案例 中 各 有 一 个 案例 是 大 多 数 Java 开 发 人 员 都 使 用 过 的 工具 或 技术 ， 另 外 一 个 案例 虽然 不 一 定 每 个 
人 都 使 用 过 ， 但 特别 精彩 地 演绎 出 这 个 领域 中 的 技术 特性 。 希 望 这 些 案例 能 引起 你 的 思考 ， 并 给 你 的 日 常 工作 带 来 灵感 。 


























9.2.1 Tomcat: 正统 的 类 加 载 器 架构 

















主流 的 Java Web 服 务 器 ， 如 Tomcat、Jetty、WebLogic、Websphere 或 其 他 笔者 没有 列举 的 服务 器 ， 都 实现 了 自己 定义 的 类 加 载 器 (一 般 都 不 止 一 个 ) 。 因 为 一 个 功能 健全 的 Web 服 务 器 ， 都 要 解决 


如 下 几 个 问题 : 





:部署 在 同一 个 服务 器 上 的 两 个 Web 应 用 程序 所 使 用 的 Java 类 库 可 以 实现 相互 隔离 。 这 是 最 基本 的 需求 ， 两 个 不 同 的 应 用 程序 可 能 会 依赖 同一 个 第 三 方 类 库 的 不 同 版 本 ， 不 能 要 求 一 个 类 库 在 一 个 服务 器 
中 只 有 一 份 ， 服 务 器 应 当 可 以 保证 两 个 应 用 程序 的 类 库 可 以 互相 独立 使 用 。 


“ 部 署 在 同一 个 服务 器 上 的 两 个 Web 应 用 程序 所 使 用 的 Java 类 库 可 以 互相 共享 。 这 个 需求 也 很 常见 ， 例 如 用 户 可 能 有 10 个 使 用 Spring 组 织 的 应 用 程序 部 署 在 同一 台 服 务 器 上 ， 如 果 把 10 份 Spring 分 别 存放 在 
各 个 应 用 程序 的 隔离 目录 中 ， 将 会 是 很 大 的 资源 浪费 一 这 主要 倒 不 是 浪费 磁盘 空间 的 问题 ， 而 是 指 类 库 在 使 用 时 都 要 被 加 载 到 服务 器 内 存 ， 如 果 类 库 不 能 共享 ， 虚 拟 机 的 方法 区 很 容易 就 会 出 现 过 度 膨 胀 
的 风险 。 

“ 服务 器 需要 尽 可 能 地 保证 自身 的 安全 不 受 部 署 的 Web 应 用 程序 影响 。 目 前 ， 有 许多 主流 的 Java Web 服 务 器 自身 也 是 使 用 Java 语 言 来 实现 的 。 因 此 服务 器 本 身 也 有 类 库 依 赖 的 问题 ， 一 般 来 说 ， 基 于 安全 
考虑 ， 服 务 器 所 使 用 的 类 库 应 该 与 应 用 程序 的 类 库 互 相 独 立 。 

“ 支持 JSP 应 用 的 Web 服 务 器 ， 十 有 八 九 都 需要 支持 HotSwap 功 能 。 我 们 知道 JSP 文 件 最 终 要 被 编译 成 Java Class 才 能 被 虚拟 机 执行 ， 但 JSP 文 件 由 于 其 纯 文本 存储 的 特性 ， 被 运行 时 修改 的 概率 远 远大 于 第 三 
方 类 库 或 程序 自己 的 Class 文 件 。 而 且 ASP、PHP 和 JSP 这 些 网 页 应 用 也 把 修改 后 无 须 重 启 作为 一 个 很 大 的 “优势 ”来 看 待 ， 因 此 “主流 ”的 Web 服 务 器 都 会 支持 JSP 生 成 类 的 热 蔡 换 ， 当 然 也 有 “ 非 主 流 ” 的 ， 
如 运行 在 生产 模式 (Production Mode) 下 的 WebLogic 服 务 器 默认 就 不 会 处 理 JSP 文 件 的 变化 。 


























由 于 存在 上 述 问题 ， 在 部 署 Web 应 用 时 ， 单 独 的 一 个 ClassPath 就 无 法 满足 需求 了 ， 所 以 各 种 Web 服 务 器 都 不 约 而 同 地 提供 了 好 几 个 ClassPath 路 径 供用 户 存放 第 三 方 类 库 ， 这 些 路 径 一 般 都 
以 “lib” 或 “classes” 命 名 。 被 放置 到 不 同 路 径 中 的 类 库 ， 具 备 不 同 的 访问 范围 和 服务 对 象 ， 通 常 ， 每 一 个 目录 都 会 有 一 个 相应 的 自 定义 类 加 载 器 去 加 载 放置 在 里 面 的 java 类 库 。 现 在 ， 笔 者 就 以 Tomcat 


服务 器 [为 例 ， 看 一 看 Tomcat 具 体 是 如 何 规划 用 户 的 类 库 结构 和 类 加 载 器 的 。 




















































































































在 Tomcat 目 录 结 构 中 ， 有 三 组 目录 (“/common/*” 、“/server/*” 和 “/shared/*” ) 可 以 存放 Java 类 库 ， 另 外 还 可 以 加 上 Web 应 用 程序 自身 的 目录 “/WEB-INF/*”， 一 共 四 组 ， 把 Java 类 库 放 
在 这 些 目录 中 的 含义 分 别 是 : 




















:放置 在 /common 目 录 中 : 类 库 可 被 Tomcat 和 所 有 的 Web 应 用 程序 共同 使 用 。 
' 放置 在 /server 目 录 中 : 类 库 可 被 Tomcat 使 用 ， 对 所 有 的 Web 应 用 程序 都 不 可 见 。 
“ 放置 在 /shared 目 录 中 : 类 库 可 被 所 有 的 Web 应 用 程序 共同 使 用 ， 但 对 Tomcat 自 己 不 可 见 。 


: 放置 在 /WebApp/WEB-INF 目 录 中 : 类 库 仅 仅 可 以 被 此 Web 应 用 程序 使 用 ， 对 Tomcat 和 其 他 Web 应 用 程序 都 不 可 见 。 











为 了 支持 这 套 目录 结构 ， 并 对 目录 里 面 的 类 库 进行 加 载 和 隔离 ，Tomcat 自 定义 了 多 个 类 加 载 器 ， 这 些 类 加 载 器 按照 经 典 的 双亲 委派 模型 来 实现 ， 其 关系 如 图 9-1 所 示 。 








灰色 背景 的 三 个 类 加 载 器 是 JDK 默 认 提供 的 类 加 载 器 ， 这 三 个 加 载 器 在 第 7 章 中 已 经 详细 介绍 过 了 。 而 CommonClassLoader、CatalinaClassLoader、SharedClassLoader 和 WebappClassLoader 则 是 
Tomcat 自 己 定义 的 类 加 载 器 ， 它 们 分 别 加 载 /common/*、/server/*、/shared/* 和 /WebApp/WEB-INF/* 中 Java 类 库 的 逻辑 。 其 中 WebApp 类 加 载 器 和 Jsp 类 加 载 器 通常 会 存在 多 个 实例 ， 每 一 个 Web 应 
程序 对 应 一 个 WebApp 类 加 载 器 ， 每 一 个 JSP 文 件 对 应 一 个 Jsp 类 加 载 器 。 


















































从 图 9-1 的 委派 关系 中 可 以 看 出 ，CommonClassLoader 能 加 载 的 类 都 可 以 被 CatalinaClassLoader 和 SharedClasLoader 使 用 ， 而 CatalinaClassLoader 和 SharedClasLoader 自 己 能 加 载 的 类 则 与 对 方 相 
互 隔离 。WebAppClassLoader 可 以 使 用 SharedClassLoader 加 载 到 的 类 ， 但 各 个 WebAppClassLoader 实 例 之 间 相 互 隔离 。 而 JasperLoader 的 加 载 范围 仅仅 是 这 个 JSP 文 件 所 编译 出 来 的 那 一 个 Class， 它 出 
现 的 目的 就 是 为 了 被 丢弃 : 当 服 务 器 检测 到 JSP 文 件 被 修改 时 ， 会 蔡 换 掉 目 前 的 JasperLoader 的 实例 ， 并 通过 再 建立 一 个 新 的 Jsp 类 加 载 器 来 实现 JSP 文 件 的 HotSwap 功 能 。 
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图 9-1 Tomcat 服 务 器 的 类 加 载 架 构 


对 于 Tomcat 的 6.x 版 本 ， 只 有 指定 了 tomcat/conf/catalina.properties 配 置 文件 的 server.loader 和 share.loader 项 后 才 会 真正 建立 CatalinaClassLoader 和 SharedClasLoaderl 














的 实例 ， 否 则 会 用 到 这 两 














个 类 加 载 器 的 地 方 都 会 用 CommonClassLoader 的 实例 来 代替 ， 而 默认 的 配置 文件 中 没有 设置 这 两 个 loader 项 ， 所 以 Tomcat 6.x 顺 理 成 章 地 把 /common、/server 和 /shared 三 个 





























录 默 认 合并 到 一 起 变 成 























一 个 /lib 目 录 ， 这 个 目录 里 的 类 库 相 当 于 以 前 /common 目 录 中 类 库 的 作用 。 这 是 Tomcat 设 计 团队 为 了 简化 大 多 数 的 部 署 场景 所 做 的 一 项 改进 ， 如 果 默 认 设 置 不 能 满足 需要 ， 用 户 可 以 通过 修改 配置 文件 指 


















































定 server.loader 和 share.loader 的 方式 重新 启用 Tomcat 5.x 的 加 载 器 架构 。 




























































































Tomcat 加 载 器 的 实现 清晰 易 懂 ， 并 且 采 用 了 官方 推荐 的 “正统 ”的 使 用 类 加 载 器 的 方式 。 如 果 读 者 阅读 完 上 面 的 案例 后 ， 能 毫 不 费力 地 完全 理解 Tomcat 设 计 团队 这 样 布 置 加 载 器 架构 的 用 意 ， 那 说 明 
您 已 经 大 致 掌握 了 类 加 载 器 “主流 ”的 使 用 方式 ， 那 么 笔者 不 妨 再 提 一 个 问题 让 各 位 思考 一 下 : 前 面 曾经 提 到 过 一 个 场景 ， 如 果 有 10 个 Web 应 用 程序 都 是 用 Spring 来 进行 组 织 和 管理 的 话 ， 可 以 把 Spring 放 
到 Common 或 Sshared 目 录 下 让 这 些 程序 共享 。Spring 要 对 用 户 程序 的 类 进行 管理 ， 自 然 要 能 访问 到 用 户 程序 的 类 ， 而 用 户 的 程序 显然 是 放 在 /WebApp/WEB-INF 目 录 中 的 。 那 么 被 CommonClassLoader 















































































































































或 sharedClassLoader 加 载 的 Spring 如 何 访问 并 不 在 其 加 载 范围 内 的 用 户 程 序 呢 ? 如 果 你 读 过 了 本 书 第 7 章 的 相关 内 容 ， 相 信 回 答 这 个 问题 一 样 会 毫 不 费力 。 


9.2.2 ”OSGi: 灵活 的 类 加 载 器 架构 





Java 程 序 社区 中 流传 着 这 么 一 个 观点 : “学 习 外 E 规 范 ， 去 看 JBoss 源码 ; 学 习 类 加 载 器 ， 就 去 看 OSG 源码 ”。 尽 管 “JE 规 范 ” 和 “类 加 载 器 的 知识 ”并 不 是 一 个 对 等 的 概念 ， 
在 程序 员 中 流传 开 来 ， 也 从 侧面 说 明了 OSGi 对 类 加 载 器 的 运用 确实 有 其 独到 之 处 。 
































不 过 ， 既 然 这 个 观点 能 
































OSGiP] (Open Service Gateway Initiative) 是 OSGi 联 盟 (OSGi Alliance) 制订 的 一 个 基于 Java 语 言 的 动态 模块 化 规范 ， 这 个 规范 最 初 由 Sun、1BM、 爱 立信 等 公司 联合 发 起 ， 目 的 是 使 服务 提供 商 









































通过 住宅 网 关 为 各 种 家 用 智能 设备 提供 各 种 服务 ， 后 来 这 个 规范 在 Java 的 其 他 技术 领域 也 有 相当 不 错 的 发 展 ， 现 在 已 经 成 为 Java 世 界 中 “事实 上 ”的 模块 化 标准 ， 并 且 已 经 有 了 Equinox、Felix 等 成 熟 的 实 
现 。OSGi 在 Java 程 序 员 中 最 著名 的 应 用 案例 就 是 Eclipse 1DE， 另 外 还 有 许多 大 型 的 软件 平台 和 中 间 件 服务 器 都 基于 或 声明 将 会 基于 OSGi 规 范 来 实现 ， 如 IBM Jazz 平 台 、GlassFlish 服 务 器 、Weblogic 10.3 




































































所 使 用 的 mSA 架 构 等 。 























OSGi 中 的 每 个 模块 ( 称 为 Bundle) 与 普通 的 Java 类 库 区 别 并 不 太 大 ， 两 者 一 般 都 以 JAR 格 式 进行 封装 ， 并 且 内 部 存储 的 都 是 Java Package 和 Class。 但 是 一 个 Bundle 可 以 声明 











它 所 依赖 的 Java 


Package (通过 |Import-Package 描 述 ) ， 也 可 以 声明 它 允 许 导 出 发 布 的 Java Package (通过 Export-Package 描 述 ) 。 在 OSGi 里 面 ，Bundle 之 间 的 依赖 关系 从 传统 的 上 层 模块 依赖 底层 模块 转变 为 平 级 模 
块 之 间 的 依赖 (至少 外 观 上 是 如 此 ) ， 而 且 类 库 的 可 见 性 能 得 到 了 非常 精确 的 控制 ， 一 个 模块 里 只 有 被 Export 过 的 Package 才 可 能 被 外 界 访问 ， 其 他 的 Package 和 Class 将 会 被 隐藏 起 来 。 除 了 更 精确 的 模块 









































划分 和 可 见 性 控制 外 ， 引 入 OSGi 的 另外 一 个 重要 理由 是 ， 基 于 OSGi 的 程序 很 可 能 (只 是 很 可 能 ， 并 不 是 一 定 会 ) 可 以 实现 模块 级 的 热 播 拔 功 能 ， 当 程序 升级 更 新 或 调试 除 错时 ， 可 以 只 停 用 、 重 新 安装 然 























后 启用 程序 的 其 中 一 部 分 ， 这 对 企业 级 程序 开发 来 说 是 一 个 非常 有 诱惑 力 的 特性 。 











OSGi 之 所 以 能 有 上 述 诱 人 的 特点 ， 要 归功 于 它 灵活 的 类 加 载 器 架构 。OSGi 的 Bundle 类 加 载 器 之 间 只 有 规则 ， 没 有 国定 的 委派 关系 。 例 如 ， 某 个 Bundle 声 明了 一 个 它 依 赖 的 Package， 如 果 有 其 人 



































已 























Bundle 声 明 发 布 了 这 个 Package 后 ， 那 么 对 这 个 Package 的 所 有 类 加 载 动作 都 会 委派 给 发 布 它 的 Bundle 类 加 载 器 去 完成 。 不 涉及 某 个 具体 的 Package 时 ， 各 个 Bundle 加 载 器 都 是 平 级 的 关系 ， 只 有 具体 使 




















到 某 个 Package 和 Class 的 时 候 ， 才 会 根据 Package 导 入 导出 定义 来 构造 Bundle 间 的 委派 和 依赖 。 




















另外 ， 一 个 Bundle 类 加 载 器 为 其 他 Bundle 提 供 服务 时 ， 会 根据 Export-Package 列 表 严 格 控制 访问 范围 。 如 果 一 个 类 存在 于 Bundle 的 类 库 中 但 是 没有 被 Export， 那 么 这 个 Bundle 的 类 加 载 器 能 找到 这 








个 类 ， 但 不 会 提供 给 其 他 Bundle 使 用 ， 而 且 OSGi 平 台 也 不 会 把 其 他 Bundle 的 类 加 载 请 求 分 配给 这 个 Bundle 来 处 理 。 

















我 们 可 以 举 一 个 更 具体 一 些 的 简单 例子 ， 假 设 存在 Bundle A、Bundle B 和 Bundle C 三 个 模块 ， 并 且 这 三 个 Bundle 定 义 的 依赖 关系 为 : 

















“ Bundle A: 声明 发 布 了 packageA， 依 赖 了 java.* 的 包 ; 
“ Bundle B: 声明 依赖 了 packageA 和 packageC， 同 时 也 依赖 了 java* 的 包 ; 


“ Bundle C: 声明 发 布 了 packageC， 依 赖 了 packageA。 





那么 ， 这 三 个 Bundle 之 间 的 类 加 载 器 及 父 类 加 载 器 之 间 的 关系 如 图 9-2 所 示 。 











区 基 加 载 厂 


ParentClassLoader 
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Bund1eh 兴 加 载 器 
BundlehClassLoader 


Bund1eC 类 加 载 器 
BundleCClassLoader 





由 于 没有 牵扯 到 具体 的 OSGi 实 现 ， 














图 中 的 类 加 载 器 都 没有 指明 


Bund1 eB 类 加 载 器 
BundleBClassLoader 


图 9-2 ”OSGi 的 类 加 载 器 架构 









































体 的 加 载 器 实现 ， 只 是 一 个 体现 了 加 载 器 间 关 系 的 概念 模型 ， 并 

















里 ， 加 载 一 个 类 可 能 发 生 的 查找 行为 和 委派 关系 会 比 图 9-2 中 显示 的 复杂 得 多 ， 类 加 载 时 可 能 进行 的 查找 规则 如 下 : 











“ 以 java* 开 头 的 类 ， 委 派 给 父 类 加 载 器 加 载 。 


“ 和 否则， 委派 列表 名 单 内 的 类 ， 委 


派 给 父 类 加 载 器 加 载 。 


“ 否则，Import 列 表 中 的 类 ， 委 派 给 Export 这 个 类 的 Bundle 的 类 加 载 器 加 载 。 


“ 和 否则， 查找 当前 Bundle 的 Classpath， 使 用 自己 的 类 加 载 器 加 载 。 


碘 
凡 


“ 否则 ， 查 找 Dynamic Import 列 表 的 Bundle， 委 派 给 对 应 Bundle 的 类 加 载 器 加 载 。 





“ 否则 ， 类 查找 失败 。 





从 图 9-2 中 还 可 以 看 出 ， 在 OSGi 里 




















的 同时 ， 也 可 能 会 产生 许多 新 的 隐患。 
发 现在 高 并 发 环境 下 经 常 出 现 死 锁 。 我 


， 加 载 器 之 间 的 关系 不 再 是 双亲 委派 模型 的 树 形 结构 ， 而 是 已 经 进一步 发 
笔者 曾经 参与 过 将 一 个 非 OSGi 的 大 型 系统 向 Equinox OSGi 平 台 迁 移 的 项 目 ， 由 于 历史 原因 














们 很 容易 就 找到 了 死 锁 的 原 





找 是 否 在 自己 的 Fragment Bundle 中 ， 如 果 是 则 委派 给 Fragment Bundle 的 类 加 载 器 加 载 。 








只 是 体现 了 OSGi 中 最 简单 的 加 载 器 委派 关系 。 一 般 来 说 ， 在 OSGi 





展 成 了 一 种 运行 时 才能 确定 的 网 状 结构 。 这 种 网 状 的 类 加 载 器 架构 在 带 来 更 优秀 的 灵活 性 
， 代 码 模块 之 间 的 依赖 关系 错综复杂 ， 勉 强 分 离 出 各 个 模块 的 Bundle 后 ， 





因 : 如 果 出 现 了 Bundle A 依赖 Bundle B 的 Package B， 而 Bundle B 又 依赖 了 Bundle A 的 Package A， 这 两 个 Bundle 进 行 类 加 载 时 就 很 容 





易 发 生死 锁 。 具 体 情况 是 当 Bundle A 加 载 Package B 的 类 时 ， 首 先 需要 锁定 当前 类 加 载 器 的 实例 对 象 (java.lang.ClassLoader.loadClass(0) 是 一 个 synchronized 方 法 ) ， 然 后 把 请 求 委派 给 Bundle B 的 加 载 





器 处 理 ， 但 如 果 这 时 候 Bundle B 也 正好 想 加 载 Package A 的 类 ， 它 也 先 锁定 自己 的 加 载 器 再 去 请 求 Bundle A 的 加 载 器 处 理 ， 这 样 两 个 加 载 器 都 在 等 待 对 方 处 理 自己 的 请 求 ， 而 对 方 处 理 完 之 前 自己 又 一 直 处 
于 同步 锁定 的 状态 ， 因 此 它们 就 互相 死 锁 ， 永 远 无 法 完成 加 载 请 求 了 。Equinox 的 Bug List 中 也 有 关于 这 类 问题 的 BugB1]， 并 提供 了 一 个 以 牺牲 性 能 为 代价 的 解决 方案 一 用 户 可 以 启 F 
线程 串 行 化 的 方式 强制 进行 类 加 载 动 作 。 在 JDK 1.7 中 ， 将 会 为 非 树 状 继承 关系 下 的 类 加 载 器 架构 进行 一 次 专门 的 升级 四， 希望 从 底层 避免 这 类 死 锁 状况 ， 





osgi.classloader.singleThreadLoads 参 数 来 按 自 


这 个 动作 也 是 为 将 来 实现 “官方 的 ” 模 


总 体 来 说 ，OSGi 描 绘 了 一 个 很 美好 的 模块 化 开发 的 
是 一 个 很 不 错 的 选择 ， 这 样 便于 约束 依赖 。 但 并 非 所 有 的 应 用 都 适合 采 


























块 化 规范 (与 前 文 所 提 的 OSGi 是 “事实 上 ”的 模块 化 规范 对 应 ) 一 JSR-297、JSR-277 做 准备 。 




















标 ， 而 且 定 义 了 实现 这 个 














标 所 需要 的 各 种 服务 ， 同 时 也 有 成 熟 框 架 对 其 提供 实现 支持 。 对 了 



































F 单 个 虚拟 机 下 的 应 用 ， 从 开发 初期 就 建立 在 OSGi 上 























9.2.3 ” 字 节 码 生 成 技术 与 动态 代理 的 实现 


“ 字 节 码 生成 ”并 不 是 什么 高 深 的 技术 ， 读 者 在 看 到 “ 字 节 码 生成 ”这 个 标题 时 也 不 必 先 去 想 诸如 Javassist、CGLib 和 ASM 之 类 的 字 节 码 类 库 ， 
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为 JDKS 





OSGi 作 为 基础 架构 ，OSGi 在 提供 强大 功能 的 同时 ， 也 引入 了 额外 的 复杂 度 ， 带 来 了 线程 死 锁 和 内 存 泄漏 的 风险 。 


面 的 javac 命 令 就 是 字 节 码 生成 技术 的 “ 老 祖 





宗 ”， 并 且 javac 也 是 一 个 由 Java 语 言 写成 的 程序 ， 它 的 代码 存放 在 OpenJDK 的 jdk7/langtools/src/share/classes/comy/suny/toolsyjavac 目 录 中 口 。 要 深入 了 





解 字 节 码 生成 ， 阅 读 javac 的 源码 是 个 很 好 的 途 

















径 ， 不 过 javac 对 于 我 们 这 个 例子 来 说 太 过 庞大 了 。 在 java 里 面 除了 javac 和 字 节 码 类 库 外 ， 使 用 到 字 节 码 生成 的 例子 还 有 很 多 ， 如 Web 服 务 器 中 的 JSP 编 译 器 ， 编 译 时 织 入 的 AOP 框 架 ， 还 有 很 常用 的 动态 代 
理 技术 ， 甚 至 在 使 用 反射 的 时 候 虚 拟 机 都 有 可 能 会 在 运行 时 生成 字 节 码 来 提高 执行 速度 。 我 们 选择 其 中 相对 简单 的 动态 代理 来 看 看 字 节 码 生成 技术 是 如 何 影响 程序 运作 的 。 


























相信 许多 Java 开 发 人 员 都 使 用 过 动态 代理 ， 即 使 没有 直接 使 









































过 java.lang.reflect.Proxy 或 实现 过 java.lang.reflect.InvocationHandler 接 口 ， 应 该 也 用 过 Spring 来 做 过 Bean 的 组 织 管理 。 如 果 使 用 过 

















Spring， 那 大 多 数 情况 下 就 都 用 过 动态 代理 ， 因 为 如 果 Bean 是 面向 接口 编程 ， 那 么 在 Spring 内 部 则 都 是 通过 动态 代理 的 方式 来 对 Bean 进 行 增强 的 。 动 态 代理 中 所 谓 的 “动态 ”， 是 针对 使 用 java 代码 实际 























编写 了 代理 类 的 “静态 ”代理 而 言 的 ， 它 的 优势 不 在 于 省 去 了 编写 代理 类 那 一 点 工作 量 ， 而 是 实现 了 可 以 在 原始 类 和 接口 还 未 知 的 时 候 ， 就 确定 代理 类 的 代理 行为 ， 当 代理 类 与 原始 类 脱离 直接 联系 后 ， 就 
可 以 很 灵活 地 重用 于 不 同 的 应 用 场景 之 中 。 
















































































代码 清单 9-1 演 示 了 一 个 最 简单 的 动态 代理 的 用 法 ， 原 始 的 逻辑 是 打印 一 句 “hello world”， 代 理 类 的 逻辑 是 在 原始 类 的 方法 执行 前 打印 一 句 “welcome”。 我 们 先 看 一 下 代码 ， 然 后 再 分 析 JDK 是 如 
何 做 到 的 。 





代码 清单 9-1 动态 代理 的 简单 示例 





public class DynamicProxyTest { 
interface IHello { 
void sayHello(); 
} 
static class Hello implements IHello { 
QOverride 
public void sayHello() { 
System.out.println ("hello world"); 
} 
} 
static Class DynamicProxy implements InvocationHandler { 
Object originalObj; 
Object bind(Object originalObj) { 
this.originalObj = originalObj; 
return Proxy.newProxyInstance (originalObj .getClass () .getClassLoader (), originalObj.getClass() .getInterfaces(), this); 


QOverride 
public Object invoke (Object proxy, Method method, Object[] args) throws Throwable { 
System.out .println ("welcome"); 
return method.invoke (originalObj, args); 
} 
} 
public static void main (String[] args) { 
IHello hello = (IHello) new DynamicProxy() .bind (new Hello()); 
hello.sayHello() 





运行 结果 如 下 : 





welcome 
hello world 














上 述 代 码 中 ， 唯 一 的 “黑匣子 ”就 是 Proxy.newProxylnstance( 方 法 ， 除 此 之 外 再 没有 任何 特殊 之 处 。 这 个 方法 返回 一 个 实现 了 IHello 的 接口 ， 并 且 代 理 了 new Hello0 实 例 行 为 的 对 象 。 跟 踪 这 个 方法 
的 源码 ， 可 以 看 到 程序 进行 了 验证 、 优 化 、 缓 存 、 同 步 、 生 成 字 节 码 和 显 式 类 加 载 等 操作 ， 前 面 的 步骤 并 不 是 我 们 关注 的 重点 ， 而 最 后 它 调用 了 sun.misc.ProxyGenerator.generateProxyClass() 方 法 来 完 
成 生成 字 节 码 的 动作 ， 这 个 方法 可 以 在 运行 时 产生 一 个 描述 代理 类 的 字 节 码 byte[] 数 组 。 如 果 想 看 一 看 这 个 方法 在 运行 时 产生 的 代理 类 中 写 了 些 什 么 ， 可 以 在 main() 方 法 中 加 入 下 面 这 句 : 



































System.getProperties () .put ("sun.misc.ProxyGenerator.saveGeneratedFiles", "true"); 


























加 入 这 名 代码 后 再 次 运行 程序 ， 磁 盘 中 将 会 产生 一 个 名 为 “$Proxy0.class” 的 代理 类 Class 文 件 ， 反 编译 后 可 以 看 见 如 代码 清单 9-2 所 示 的 内 容 。 











代码 清单 9-2 反 编 译 的 动态 代理 类 的 代码 








Package org.fenixsoft .bytecode; 
import java.lang.reflect.InvocationHandler; 
import java.lang.reflect.Method; 
import java.lang.reflect.Proxy; 
import java.lang.reflect.UndeclaredThrowableException; 
public final class $Proxy0 extends Proxy 
implements DynamicProxyTest.IHello 
{ 
private static Method m3; 
private static Method ml; 
private static Method m0; 
private static Method m2; 
public $Proxy0 (InvocationHandler paramInvocationHandler) 
throws 
super (paramInvocationHandler); 
} 
public final void sayHello() 
throws 
{ 
try 
{ 
this.h.invoke (this, m3, nul1); 
return; 
} 
catch (RuntimeException localRuntimeException) 
{ 


throw localRuntimeException; 


} 
catch (Throwable localThrowable) 
{ 
throw new UndeclaredThrowableException (localThrowable); 
} 


} 
// 此 处 由 于 版 面 原因 ， 省 略 了 equals ()、hashCode () 、toString () 三 个 方法 的 代码 
// 这 3 个 方法 的 内 容 与 sayHello () 非常 相似 


static 
{ 
try 
{ 
m3 = Class.forName ("org.fenixsoft .bytecode.DynamicProxyTest$IHello") .getMethod ("sayHello", new Class[0]); 
ml = Class.forName ("java.lang.Object") .getMethod ("equals", new Class[] { Class.forName ("java.lang.Object") }); 
m0 = Class.forName ("java.lang.Object") .getMethod ("hashCode", new Class[0]); 
m2 = Class.forName ("java.lang.Object") .getMethod ("toString", new Class[0]); 
return; 


} 
catch (NoSuchMethodException localNoSuchMethodException) 
throw new NoSuchMethodError (localNoSsuchMethodException.getMessage ()); 


catch (ClassNotFoundException localClassNotFoundException) 
. 
throw new NoClassDefFoundError (localClassNotFoundException.getMessage()); 
} 
} 
} 























这 个 代理 类 的 实现 代码 也 很 简单 ， 它 为 传 入 接口 中 的 每 一 个 方法 ， 以 及 从 java.lang.Object 中 继承 来 的 equals0、hashCode(0、tostring() 方 法 都 生成 了 对 应 的 实现 ， 并 且 统 一 调用 了 
InvocationHandler 对 象 的 invoke() 方 法 (代码 中 的 “this.h” 就 是 父 类 Proxy 中 保存 的 InvocationHandler 实 例 变量 ) 来 实现 这 些 方法 的 内 容 ， 各 个 方法 的 区 别 不 过 是 传 入 的 参数 和 Method 对 象 有 所 不 同 而 
已 ， 所 以 无 论调 用 动态 代理 的 哪 一 个 方法 ， 实 际 上 都 是 在 执行 InvocationHandler.invoke(0 中 的 代理 逻辑 。 













































































这 个 例子 中 并 没有 讲 到 generateProxyClass() 方 法 具体 是 如 何 产生 代理 类 “$Proxy0.class” 的 字 节 码 的 ， 大 致 的 生成 过 程 其 实 就 是 根据 Class 文 件 的 格式 规范 去 拼装 字 节 码 ， 但 是 在 实际 开发 中 ， 以 pyte 



































为 单位 直接 拼装 出 字 节 码 的 应 用 场合 很 少见 ， 这 种 生成 方式 也 只 能 产生 一 些 高 度 模板 化 的 代码 。 对 于 用 户 的 程序 代码 来 说 ， 如 果 有 要 大 量 操作 字 节 码 的 需求 ， 还 是 使 用 封装 好 的 字 节 码 类 库 比较 合适 。 如 果 
和 


你 对 动态 代理 的 字 节 码 拼 装 过 程 确实 很 感 兴趣 ， 可 以 在 OpenJDK 的 jdk/src/share/classes/sun/misc 目 录 下 找到 sun.misc.ProxyGenerator 的 源码 。 





















































9.2.4 Retrotranslator: 跨越 JDK 版 本 











一 般 来 说 ， 以 “做 项 目 ” 为 主 的 软件 公司 比较 容易 更 新 技术 ， 在 下 一 个 项 目 中 换 一 个 技术 框架 、 升 级 到 最 时 里 的 JDK 版 本 、 甚 至 把 Java 换 成 C# 来 开发 都 是 有 可 能 的 。 但 是 当 公司 发 展 壮大 ， 技 术 有 所 积 
累 ， 逐 渐 成 为 以 “做 产品 ”为 主 的 软件 公司 后 ， 自 主 选 择 技术 的 权利 就 会 形 失 掉 ， 因 为 之 前 所 积累 的 代码 和 技术 都 是 用 真 金 白 银 磺 出 来 的 ， 一 个 稳健 的 团队 也 不 会 随意 地 改变 底层 的 技术 。 然 而 在 飞速 发 展 
的 程序 设计 领域 ,新 技术 总 是 日 新 月 异 层出不穷 ， 偏 偏 这 些 新 技术 又 如 鲜花 之 于 蜜蜂 、 美 酒 之 于 醉 汉 一 样 ， 对 程序 员 们 有 着 难以 抗拒 的 吸引 力 。 
















































































在 Java 的 世界 里 ， 每 一 次 JDK 大 版 本 的 发 布 ， 就 伴随 着 一 场 大 规模 的 技术 革新 ， 而 对 Java 程 序 编写 习惯 改变 最 大 的 ， 无 疑 是 JDK 1.5 的 发 布 。 自 动 装 箱 、 泛 型 、 动 态 注解 、 枚 举 、 变 长 参数 、 遍 历 循环 
(foreach 循 环 ) .…… 事 实 上 在 没有 这 些 语法 特性 的 年 代 ，Java 程 序 也 照样 能 写 ， 但 是 现在 看 来 ， 上 述 每 一 种 语法 的 改进 几乎 都 是 “ 必 不 可 少 ”的 。 就 如 用 习惯 了 24 寸 液晶 显示 器 的 程序 员 ， 很 难 再 在 15 寸 纯 
平 显示 器 上 编写 代码 。 但 假如 “不 幸 ” 因 为 要 保护 现 有 投资 、 维 持 程序 结构 稳定 等 ， 必 须 使 用 1.5 以 前 版 本 的 JDK 呢 ? 幸好 ， 我 们 没有 办 法 把 15 寸 纯 平 显示 器 变 成 24 寸 液晶 显示 器 ， 但 却 可 以 跨越 JDK 版 本 之 
间 的 沟 毛 ， 把 JDK 1.5 中 编写 的 代码 放 到 JDK 1.4 或 1.3 的 环境 中 去 部 署 和 使 用 。 为 了 解决 这 个 问题 ， 一 种 名 为 “java 逆向 移植 ”的 工具 (Java Backporting Tools) 应 运 而 生 ，Retrotranslatorl6| 是 这 类 工 
中 最 出 色 的 一 个 。 
























































































































































Retrotranslator 的 作用 是 将 JDK 1.5 编 译 出 来 的 Class 文 件 转变 为 可 以 在 JDK 1.4 或 1.3 上 部 署 的 版 本 ， 它 可 以 很 好 地 支持 自动 装 箱 、 泛 型 、 动 态 注解 、 枚 举 、 变 长 参数 、 遍 历 循 环 、 静 态 导入 这 些 语法 特 
性 ， 甚 至 还 可 以 支持 JDK 1.5 中 新 增 的 集合 改进 、 并 发 包 及 对 泛 型 、 注 解 等 的 反射 操作 .…… 咽 ， 差 不 多 了 ， 毕 况 Retrotranslator 也 没有 给 笔者 广告 赞助 费 。 了 解 了 Retrotranslator 这 种 逆向 移植 工具 可 以 做 什 
么 后 ， 现 在 关心 的 是 它 是 怎样 做 到 的 ? 









































本 


要 想 知 道 Retrotranslator 是 如 何在 旧版 本 JDK 中 模拟 新 版 本 JDK 的 功能 ， 首 先 要 搞 清楚 JDK 升 级 中 会 提供 哪些 新 的 功能 。JDK 的 每 次 升级 中 新 增 的 功能 大 致 可 以 分 为 以 下 





类 : 





“ 在 编译 器 层面 所 做 的 改进 。 如 自动 装 箱 拆 箱 ， 实 际 上 就 是 编译 器 在 程序 中 使 用 到 包装 对 象 的 地 方 自动 插入 了 很 多 IntegervalueOf0 和 FloatvalueOf0 之 类 的 代码 ; 变 长 参数 在 编译 之 后 就 被 自动 转化 成 了 


一 个 数组 来 完成 参数 传递 ; 泛 型 的 信息 则 在 编译 阶段 就 已 经 被 擦 除 掉 了 (但 是 在 元 数据 中 还 保留 着 ) ， 相 应 的 地 方 被 编译 器 自动 插入 了 类 型 转换 代码 |。 
: 对 Java API 的 代码 增强 。 壁 如 JDK 1.2 时 代 引 入 的 java.util.Collections 等 一 系列 集合 类 ， 在 JDK 1.5 时 代 引 入 的 java.util.concurrent 并 发 包 等 。 


“ 需要 在 字 节 码 中 进行 支持 的 改动 。 如 JDK 1.7 里 面 新 加 入 的 语法 特性 : 动态 语言 支持 ， 就 需要 在 虚拟 机 中 新 增 一 条 invokedynamic 字 节 码 指令 来 实现 相关 的 调用 功能 。 不 过 字 节 码 指 令 集 一 直 处 于 相对 比 
较 稳定 的 状态 ， 这 种 需要 在 字 节 码 层 面 直接 进行 的 改动 是 比较 少见 的 。 


“ 虚拟 机 内 部 的 改进 。 如 JDK 1.5 中 实现 的 JSR-133 冉 规范 重新 定义 的 Java 内 存 模型 JMM，]Java Memory Model) 、CMS 收 集 器 之 类 的 改动 ， 这 类 改动 对 于 程序 员 编 写 代 码 基本 是 透明 的 ， 但 会 对 程序 运行 
时 产生 影响 。 








上 述 四 类 新 功能 中 ，Retrotranslator 只 能 模拟 前 两 类 ， 对 于 后 面 两 类 直接 在 虚拟 机 内 部 实现 的 改进 ， 一 般 所 有 的 逆向 移植 工具 都 无 能 为 力 ， 至 少 不 能 完整 地 或 者 在 可 接受 的 效率 上 完成 全 部 模拟 ， 否 则 
虚拟 机 设计 团队 也 没有 必要 舍 近 求 远 地 改 动 处 于 JDK 底 层 的 虚拟 机 。 在 可 以 模拟 的 两 类 功能 中 ， 第 二 类 模拟 相对 更 容易 实现 一 些 ， 如 JDK 1.5 引 入 的 java.util.concurrent 包 ， 实 际 是 由 多 线程 大 师 Doug Lea 
开发 的 一 套 并 发 包 ， 在 JDK 1.5 出 现 之 前 就 已 经 存在 ( 那 时 候 名 字 叫 做 dl.utilconcurrent， 引 入 JDK 时 由 作者 的 JDK 开 发 团队 共同 做 出 了 一 些 改进 ) ， 所 以 要 在 旧 的 JDK 中 支持 这 部 分 功能 ， 以 独立 类 库 的 方 
式 便 可 实现 。Retrotranslator 中 就 附带 了 一 个 名 为 “backport-util-concurrent.jar” 的 类 库 (由 另 一 个 名 为 “Backport ot JSR 166” 的 项 目 所 提供 ) 来 代替 JDK 1.5 的 并 发 包 。 


















































至 于 JDK 在 编译 阶段 进行 处 理 的 那些 改进 ，Retrotranslator 则 是 使 用 ASM 框 架 直 接 对 字 节 码 进 行 处 理 。 由 于 组 成 Class 文 件 的 字 节 码 指令 数量 并 没有 改变 ， 所 以 无 论 是 JDK 1.3、JDK1.4 还 是 JDK 1.5， 能 
字 节 码 表达 的 语义 范围 应 该 是 一 致 的 。 当 然 ， 肯 定 不 可 能 简单 地 把 Class 的 文件 版 本 号 从 49.0 改 回 48.0 就 能 解决 问题 了 ， 虽 然 字 节 码 指令 的 数量 没有 变化 ， 但 是 元 数据 信息 和 一 些 语法 支持 的 内 容 还 是 要 做 
相应 的 修改 。 以 枚 举 为 例 ， 在 JDK 1.5 中 增加 了 enum 关 键 字 ， 但 是 Class 文 件 常量 池 的 CONSTANT_ Class_info 类 型 常量 并 没有 发 生 任何 语义 变化 ， 仍 然 是 代表 一 个 类 或 接口 的 符号 引用 ， 没 有 加 入 枚 举 ， 也 
没有 增加 过 “CONSTANT_Enum_info” 之 类 的 “ 枚 举 符号 引用 ”常量 。 所 以 使 用 enum 关 键 字 定 义 常量 ， 虽 然 从 Java 语 法 上 看 起 来 与 使 用 class 关 键 字 定 义 类 、 使 用 interface 关 键 字 定义 接口 是 同一 层次 
的 ， 但 实际 上 这 是 由 Javac 编 译 器 做 出 来 的 假象 ， 从 字 节 码 的 角度 来 看 ， 枚 举 仅仅 是 一 个 继承 于 java.lang.Enum、 自 动 生成 了 values0 和 valueOf() 方 法 的 普通 Java 类 而 已 。 



































































































































Retrotranslator 对 枚 举 所 做 的 主要 处 理 就 是 把 枚 举 类 的 父 类 从 “java.lang.Enum” 替换 为 它 运行 时 类 库 中 包含 的 “net.sf.retrotranslator.runtimejava.lang.Enum_” ， 然 后 再 在 类 和 字段 的 访问 标志 
中 抹 去 ACC_ENUM 标 志 位 。 当 然 ， 这 只 是 处 理 的 总 体 思路 ， 具 体 的 实现 要 比 上 面 说 的 复杂 得 多 。 可 以 想象 既然 两 个 父 类 的 实现 都 不 一 样 ，values0 和 valueOf( 的 方法 自然 需要 重 写 ， 常 量 池 需 要 引入 大 量 新 
的 来 自 父 类 的 符号 引用 ， 这 些 都 是 实现 细节 。 图 9-3 是 一 个 使 用 IDK 1.5 编 译 的 枚 举 类 与 被 Retrotranslator 转 换 处 理 后 的 字 节 码 的 对 比 图 。 



























































































































































D:\Source\Concole\WebContent \WEB-INF\classes\console... [( 王 [© [% 












:和 EE | Minor version: 0 
由 Constant Pool Major version.: 49 
i 各 Interfaces Constant pool count.: 54 
由 ND Fields Access flags: Ox4031 [[publie finsl enun]| 
由 局 Methods This class: cp info #1 < fenix/console/domai 
9 局 Attributes Super class: cp info #3 [Cjava/lang/Enun)| 
Interfaces courit : 0 
Fields count.: 5 
Methods court : = 
Attributes count.: 2 


erverStatus. class EGG 可 EE< 





Minor verslor: 0 

昌国 Constant Pool 

各 Interfaces Constant pool count : 74 

昌 -… ND Fields Access flags: 0x0031| [public final ] 

9 和 Methods This class: cp info #2 < fenix/console/domai 
日 局 Attributes Super class: cp info #5 [<net/sf/retrotranslat| 
Interfaces courit : 0 

Fields court : 5 

Methods count.: = 

Attributes count.: 2 





图 9-3 Retrotranslator 处 理 前 后 的 枚 举 类 字 节 码 对 比 
1] Tomcat 是 Apache 基 金 会 下 一 款 开源 的 Java Web 服 务 器 ， 主 页 地 址 为 : http://tomcat.apache.org。 本 案例 中 选用 的 是 Tomcat 5.x 服 务 器 的 目录 和 类 加 载 器 结构 ， 在 Tomcat 6.x 的 默认 配置 下 ，/common、/server 
和 /shared 三 个 目录 已 经 合并 到 一 起 了 。 
2] 官方 站 点 : http://www.osgi.org/Main/HomePage。 
3] Bug-121737 : https://bugs.eclipse.org/bugs/show_bugcgizid=121737。 
4] JDK 1.7-Upgrade class-loader architecture : http://openjdk.java.net/projects/jdk7/features/#f352。 
5] 如 何 获取 OpenJDK 源 码 ， 请 参见 本 书 第 1 章 的 相关 内 容 。 
0] 官方 站 点 : http://retrotranslator.sf.net。 
四 如 果 想 了 解 编译 器 在 这 个 阶段 所 做 的 各 种 动作 的 详细 信息 ， 可 以 参考 第 10 章 的 “ 解 语法 糖 ” 部 分 。 
8] JSR-133: Java Memory Model and Thread Specification Revision (Java 内 存 模型 和 线程 规范 修订 ) 。 








9.3 ”实战 : 自己 动手 实现 远程 执行 功能 


不 知道 读者 在 做 程序 维护 的 时 候 是 否 遇 到 过 这 类 情形 : 排查 问题 的 过 程 中 ， 想 查看 内 存 中 的 一 些 参数 值 ， 却 又 没有 方法 把 这 些 值 输出 到 界面 或 日 志 中 。 又 或 者 定位 到 某 个 缓存 数据 有 问题 ， 但 缺少 缓存 
的 统一 管理 界面 ， 不 得 不 重启 服务 才能 清理 掉 这 个 缓存 。 类 似 的 需求 有 一 个 共同 的 特点 ， 就 是 只 要 在 服务 中 执行 一 段 程序 代码 ， 就 可 以 定位 或 排除 问题 ， 但 就 是 偏偏 找 不 到 可 以 让 服务 器 执行 临时 代码 的 途 
径 ， 这 时 候 多 希望 java 服务 器 中 也 有 提供 类 似 Groovy Console 的 功能 啊 。 








JDK 1.6 之 后 提供 了 Compiler API， 可 以 动态 地 编译 java 程序， 这样 虽 然 达 不 到 动态 语言 的 灵活 度 ， 但 让 服务 器 执行 临时 代码 的 需求 是 可 以 得 到 解决 了 。 在 JDK 1.6 之 前 ， 也 可 以 通过 “曲线 救国 ”的 方 
式 来 做 到 ， 璧 如 写 一 个 JSP 文 件 上 传 到 服务 器 ， 然 后 在 浏览 器 中 运行 它 ， 或 者 在 服务 端的 程序 中 加 入 一 个 BeanShell Script、JavaScript 等 的 执行 引擎 如 Mozila Rhino[1) 去 执行 动态 脚本 。 在 本 章 的 实战 
部 分 ， 我 们 将 使 用 前 面 学 到 的 关于 类 加 载 及 虚拟 机 执行 子 系统 的 知识 去 完成 在 服务 端 执行 临时 代码 的 功能 。 


9.3.1 目标 
在 实现 “在 服务 端 执行 临时 代码 ”这 个 需求 之 前 ， 先 来 明确 一 下 本 次 实战 的 具体 目标 ， 我 们 希望 最 终 的 产品 是 这 样 的 : 
“ 不 依赖 JDK 版 本 ， 能 在 目前 还 被 普遍 使 用 的 JDK 中 部 署 ， 也 就 是 使 用 DK 1.4 至 JDK 1.7 都 可 以 运行 。 
“ 不 改变 原 有 服务 端 程序 的 部 署 ， 不 依赖 任何 第 三 方 类 库 。 
“ 不 侵入 原 有 程序 ， 即 无 须 改 动 原 程序 的 任何 代码 。 也 不 会 对 原 有 程序 的 运行 带 来 任何 影响 。 
“ 考虑 到 BeanShell Script 或 JavaScript 等 脚本 编写 起 来 不 太 方便 ，“ 临 时 代码 ”需要 直接 支持 Java 语 言 。 


“ “临时 代码 ”应 当 具 备 足够 的 自由 度 ， 不 需要 依赖 特定 的 类 或 实现 特定 的 接口 。 这 里 写 的 是 “不 需要 ”而 不 是 “不 可 以 ”， 当 “临时 代码 ”需要 引用 其 他 类 库 时 也 没有 限制 ， 只 要 服务 端 程序 能 使 用 
的 ， 临 时 代码 应 当 都 能 直接 引用 。 


“临时 代码 ”的 执行 结果 能 返回 到 客户 端 ， 执 行 结果 可 以 包括 程序 中 输出 的 信息 及 抛 出 的 异常 等 。 





看 完 上 面 列 出 的 目标 ， 你 觉得 完成 这 个 需求 需要 做 多 少 工作 呢 ? 也 许 答案 比 大 多 数 人 所 想 的 都 要 简单 一 些 : 5 个 类 ，250 行 代码 ( 含 注释 ) ， 大 约 一 个 半 小 时 左右 的 开发 时 间 就 可 以 了 ， 现 在 就 开始 编写 
程序 吧 ! 








9.3.2 思路 





在 程序 实现 的 过 程 中 ， 我 们 需要 解决 以 下 三 个 问题 : 
. 如 何 编译 提交 到 服务 器 的 Java 代 码 ? 
. 如 何 执行 编译 之 后 的 Java 代 码 ? 


: 如何 收集 Java 代 码 的 执行 结果 ? 

















对 于 第 一 个 问题 ， 我 们 有 两 种 方案 可 以 选择 ， 一 个 是 使 用 toolsjar 包 (在 Sun JDK/lib 目 录 下 ) 中 的 com.sun.tools.javac.Main 类 来 编译 Java 文 件 ， 这 其 实 和 使 用 Javac 命 令 来 编译 是 一 样 的 。 这 种 思路 的 
缺点 是 引入 了 额外 的 JAR 包 ， 而 且 把 程序 绑 死 在 Sun 的 JDK 上 了 ， 要 部 署 到 其 他 公司 的 JDK 中 还 得 把 tools.jar 带 上 (虽然 JRockit 和 J9 虚 拟 机 也 有 这 个 JAR 包 ， 但 它 总 不 是 标准 所 规定 必须 存在 的 ) 。 另 外 一 种 
思路 是 直接 在 客户 端 编译 好 ， 把 字 节 码 而 不 是 Java 代 码 传 到 服务 端 ， 这 听 起 来 好 像 有 点 投机 取 巧 ， 一 般 来 说 确实 不 应 该 假定 客户 端 一 定 具 有 编译 代码 的 能 力 ， 但 是 既然 程序 员 会 写 Java 代 码 去 给 服务 端 排查 
问题 ， 那 么 很 难 想象 他 的 机 器 上 会 连 编译 Java 程 序 的 环境 都 没有 。 


















































对 于 第 二 个 问题 ， 简 单 地 一 想 : 要 执行 编译 后 的 Java 代 码 ， 让 类 加 载 器 加 载 这 个 类 生成 一 个 Class 对 象 ， 然 后 反射 调用 一 下 某 个 方法 就 可 以 了 (因为 不 实现 任何 接口 ， 我 们 可 以 借用 一 下 java 中 人 人 皆 知 
的 “main0” 方 法 ) 。 但 我 们 还 应 该 考虑 得 更 周全 些 : 一 段 程序 往往 不 是 编写 和 运行 一 次 就 能 达到 效果 ， 同 一 个 类 可 能 要 被 反复 地 修改 、 提 交 和 执行 。 另 外 ， 提 交 上 去 的 类 要 能 访问 到 服务 端的 其 他 类 库 才 
行 。 还 有 就 是 ， 既 然 提交 的 是 临时 代码 ， 那 提交 的 Java 类 在 执行 完 后 就 应 当 能 被 卸载 和 回收 掉 。 

































































最 后 一 个 问题 ， 我 们 想 把 程序 往 标准 输出 (System.out) 和 标准 错误 输出 (System.err) 中 打印 的 信息 收集 起 来 。 但 标准 输出 设备 是 整个 虚拟 机 进程 级 别 的 资源 ， 如 果 使 
System.setOut(0/System.setErr() 方 法 把 输出 流 重 定向 到 自己 定义 的 PrintStream 对 象 上 固然 可 以 收集 到 输出 信息 ， 但 也 会 对 原 有 程序 产生 影响 : 会 把 其 他 进程 向 标准 输出 中 打印 的 信息 也 收集 了 。 虽 然 这 些 
并 不 是 不 能 解决 的 问题 ， 不 过 为 了 达到 完全 不 影响 原 程序 的 目的 ， 我 们 可 以 采用 另外 一 种 办 法 : 直接 在 执行 的 类 中 把 对 System.out 的 符号 引用 替换 为 我 们 准备 的 PrintStream 的 符号 引用 ， 依 赖 前 面 学 习 到 
的 知识 ， 做 到 这 一 点 并 不 困难 。 











































































































9.3.3 实现 


















































在 程序 实现 部 分 ， 我 们 主要 来 看 看 代码 及 其 中 的 注释 。 首 先 看 看 实现 过 程 中 需要 用 到 的 四 个 支持 类 。 第 一 个 类 用 于 实现 同一 个 类 的 代码 可 以 被 多 次 加 载 ， 即 用 于 解决 上 一 节 列 举 的 第 2 个 问题 的 
HotSwapClassLoader， 具 体 程序 如 下 面 的 代码 清单 9-3 所 示 。 



























































HotSwapClassLoader 所 做 的 事情 仅仅 是 公开 父 类 ( 即 java.lang.ClassLoader) 中 的 protected 方 法 defineClass()， 我 们 将 会 使 用 这 个 方法 把 提交 执行 的 Java 类 的 byte[] 数 组 转变 为 Class 对 象 。 
HotSwapClassLoader 中 并 没有 重 写 loadClass() 或 findClass() 方 法 ， 因 此 如 果 不 算 外 部 手工 调用 loadByte() 方 法 的 话 ， 这 个 类 加 载 器 的 类 查找 范围 与 它 的 父 类 加 载 器 是 完全 一 致 的 ， 在 被 虚拟 机 调用 时 ， 它 会 
按照 双亲 委派 模型 交 给 父 类 加 载 。 构 造 函数 中 指定 为 加 载 HotSwapClassLoader 类 的 类 加 载 器 作为 父 类 加 载 器 ， 这 一 步 是 实现 提交 的 执行 代码 可 以 访问 服务 端 引用 类 库 的 关键 ， 下 面 我 们 来 看 看 代码 清单 9- 
3。 
















































































代码 清单 9-3 ”HotSwapClassLoader 的 实现 





/** 
* 为 了 多 次 载 入 执行 类 而 加 入 的 加 载 器 <br> 
* 把 defineClass 方 法 开放 出 来 ， 只 有 外 部 显 式 调用 的 时 候 才 会 使 用 到 loadByte 方 法 
* 由 虚拟 机 调用 时 ， 仍 然 按 照 原 有 的 双亲 委派 规则 使 用 1oadclass 方 法 进行 类 加 载 
* @author zzm 
wy 
public class HotSwapClassLoader extends ClassLoader { 
public HotSwapClassLoader() { 
super (HotSwapClassLoader.class.getClassLoader ()); 







} 
public Class loadByte (byte[] classByte) { 

return defineClass (null, classByte, 0, classByte.length); 
} 








第 二 个 类 是 实现 将 java.lang.System 蔡 换 为 我 们 自己 定义 的 HackSystem 类 的 过 程 ， 它 直接 修改 符合 Class 文 件 格式 的 byte[ 数 组 中 的 常量 池 部 分 ， 将 常量 池 中 指定 内 容 的 CONSTANT_Utf8_info 常 量 
换 为 新 的 字符 串 ， 具 体 代 码 如 下 面 的 代码 清单 9-4 所 示 。ClassModifier 中 涉及 对 byte[ 数 组 操作 的 部 分 ， 主 要 是 将 byte[] 与 int 和 String 互 相 转 换 ， 以 及 把 对 byte[] 数 据 的 替换 操作 封装 在 代码 清单 9-5 所 示 的 
ByteUtils 中 。 



























































经 过 ClassModifier 处 理 后 的 byte[] 数 组 才 会 传 给 HotSwapClassLoader.loadByte() 方 法 进行 类 加 载 ，byte[] 数 组 在 这 里 蔡 换 符号 引用 之 后 ， 与 客户 端 直接 在 java 代码 中 引用 HackSystem 类 再 编译 生成 的 
Class 是 完全 一 样 的 。 这 样 的 实现 既 避 免 了 客户 端 编写 临时 执行 代码 时 要 依赖 特定 的 类 (不 然 无 法 引入 HackSystem) ， 又 避免 了 服务 端 修改 标准 输出 后 影响 到 其 他 程序 的 输出 。 下 面 我 们 来 看 看 代码 清单 9- 
4 和 代码 清单 9-5: 




















代码 清单 9-4 ClassModifier 的 实现 





妇 
* 修改 Class 文件 ， 和 暂时 只 提供 修改 常量 池 常 量 的 功能 
* @author zzm 

Ff 


public class ClassModifier { 
太太 
* Class 文 件 中 常量 池 的 起 始 偏 移 
半天 
private static final int CONSTANT POOL COUNT _ INDEX = 8; 
7 全 = 一 


* CONSTANT_Utf8_info 常 量 的 tag 标 志 

六 

private static final int CONSTANT Utf8 info = 1; 
大 


* 常量 池 中 11 种 常量 所 占 的 长 度 ，CONSTANT_Utf8_info 型 常量 除外 ， 因 为 它 不 是 定 长 的 
x 
2 


Private static final int[] CONSTANT TTEM LENGTH = { -1, -1l; 5 -1l; 5; 9; 9 3 3 5, 5; 5 5 7 
private static final int ul = 17 a wm 
private static final int u2 = 2; 
Private byte[] classByte; 
public ClassModifier (byte[] classByte) { 
this.classByte = classByte; 
pa 
* 修改 常量 池 中 CONSTANT Utf8 info 常 量 的 内 容 
* @param oldStr 修改 前 的 字符 串 
* Q@param newStr 修改 后 的 串 






* Q@return 修改 结果 
六 
天 
public byte[] modifyUTF8Constant (String oldStr，String newStr) { 
int cpc = getConstantPoolCount (); 
int offset = CONSTANT POOL COUNT INDEX + u2; 
for (int i = 0; i < cpc; i++) { 
int tag ByteUtils.bytes2Int (classByte, offset, ul); 
if (tag CONSTANT Utf8 info) { 
int len = ByteUtils.bytes2Int (classByte, offset + ul, u2); 
offset += (ul + u2); 
String str = ByteUtils.bytes2String (classByte, offset, len); 
if (str.equalsIgnoreCase (oldqStr)) { 
byte [] strBytes = ByteUtils.string2Bytes (newStr); 
byte[] strLen = ByteUtils.int2Bytes (newStr.length(), u2); 
ClassByte = ByteUtils.bytesReplace (classByte, offset - u2, 





u2, strLen); 
classByte = ByteUtils.bytesReplace (classByte, offset, len, 
strBytes); 
return classByte; 
} else { 
offset += len; 


} else { 
offset += CONSTANT ITEM LENGTH[tag]; 
} 


return classByte; 
} 
A 
* 获取 常量 池 中 常量 的 数量 
* @return 常量 池 数 量 
人 
public int getConstantPoolCount () { 
return ByteUtils.bytes2Int (classByte, CONSTANT POOL COUNT_INDEX，u2)， 
} 





代码 清单 9-5 ”ByteUtils 的 实现 








太太 
* Bytes 数 组 处 理工 具 
* @author 
A 
public class ByteUtils { 
public static int bytes2Int (byte[] b, int start, int len) { 
int sum = 0; 
int end = start + len; 
for (int i = start; i < end; i++) { 
int n = ((int) b[il) & Oxff; 
n <<= (--len) * 8; 
n 


} 
return sum; 
} 
public static byte[] int2Bytes (int value, int len) { 
byte[] b = new byte[llen]; 
for (int i = 0; i < len; i++) { 
bllen ~- i -~ 1] = (byte) ((value >> 8 * i) & Oxff); 
} 
return b; 
} 
public static String bytes2String (byte[] b, int start, int len) { 
return new String(b, start, len); 
} 


public static byte[] string2Bytes (String str) { 
return Str.getBytes () 7 


public static byte[] bytesReplace (byte[] originalBytes, int offset, int len，byte[] replaceBytes) { 
byte[] newBytes = new byte[originalBytes.length + (replaceBytes.length - len)]; 
System.arraycopy (originalBytes, 0, newBytes, 0, offset); 
System.arraycopy (replaceBytes, 0, newBytes, offset, replaceBytes.length); 
( 


System.arraycopy (originalBytes, offset + len, newBytes, offset + replaceBytes.length, originalBytes.length - offset - len); 
return newBytes; 












































最 后 一 个 类 就 是 前 面 提 到 过 的 用 来 代替 java.lang.System 的 HackSystem， 这 个 类 中 的 方法 看 起 来 不 少 ， 但 其 实 除了 把 out 和 err 两 个 静态 变量 改 成 使 用 ByteArrayOutputStream 作 为 打印 目标 的 同一 个 
PrintStream 对 象 ， 以 及 增加 了 读 取 、 清 理 ByteArrayOutputSstream 中 内 容 的 getBufferSstring0 和 clearBuffer() 方 法 外 ， 就 再 没有 其 他 新 鲜 的 内 容 了 。 其 余 的 方法 全 部 都 来 自 于 System 类 的 public 方 法 ， 方 


法 名 字 、 参 数 和 返回 值 都 完全 一 样 ， 并 且 实现 也 是 直接 转调 了 System 类 的 对 应 方法 而 已 。 保 留 这 些 方 法 的 目的 ， 是 为 了 在 Sytem 被 蔡 换 成 HackSystem 之 后 ， 执 行 代 码 中 调用 的 System 的 其 余 方法 仍然 可 以 
继续 使 用 ，HackSystem 的 实现 如 代码 清单 9-6 所 示 。 























































































































代码 清单 9-6 ”HackSystem 的 实现 








J 

* 为 JavaClass 动 持 java,lang .System 提 供 支 持 

* 除了 out 和 err 外 ， 其 余 的 都 直接 转发 给 System 处 理 

* @author zzm 

对 

public class HackSystem { 
public final static InPutStream in = System.in; 
private static ByteArrayOutputStream buffer = new ByteArrayOutputStream(); 
public final static PrintStream out = new PrintSstream(buffer); 
public final static PrintStream err = out; 
public static String getBufferString() { 

return buffer.toString(); 

} 


public static void clearBuffer() { 
buffer.reset (); 

public static void setSecurityManager (final SecurityManager s) { 
System.setSecurityManager (s); 

} 


public static SecurityManager getSecurityManager() { 
return System.getSecurityManager (); 
} 


public static long currentTimeMillis() { 
return System.currentTimeMillis(); 


public static void arraycopy (Object src, int srcPos, Object dest, int destPos, int length) { 
System.arraycopy (src, srcPos, dest, destPos, length); 


} 
public static int identityHashCode (Object x) { 
return System.identityHashCode (x); 


} 

// 下 面 所 有 的 方法 都 与 java.1ang .System 的 名 称 一 样 
// 实现 都 是 字 节 转调 System 的 对 应 方法 

// 因 版 面 原因 ， 省 略 了 其 他 方法 























9 个 支持 类 已 经 讲解 完毕 ， 我 们 来 看 看 最 后 一 个 类 JavaClassExecuter， 它 是 为 外 部 调用 提供 的 入 口 ， 调 用 前 面 几 个 支持 类 组 装 逻辑 ， 完 成 类 加 载 工作 。JavaClassExecuter 只 有 一 个 execute() 方 法 ,上 
输入 的 符合 Class 文 件 格式 的 byte[] 数 组 替换 掉 java.lang.System 的 符号 引用 后 ， 使 用 HotSwapClassLoader 加 载 生成 一 个 Class 对 象 ， 由 于 每 次 执行 execute() 方 法 都 会 生成 一 个 新 的 类 加 载 器 实例 ， 因 此 同一 
个 类 可 以 实现 重复 加 载 。 然 后 反射 调用 这 个 Class 对 象 的 main() 方 法 ， 如 果 期 间 出 现任 何 异常 ， 将 异常 信息 打印 到 HackSsystem.out 中 ， 最 后 把 缓冲 区 中 的 信息 作为 方法 的 结果 来 返回 。JavaClassExecuter 的 







































































实现 代码 如 代码 清单 9-7 所 示 。 


代码 清单 9-7 JavaClassExecuter 的 实现 





六 

* JavaClass 执 行 工具 

* Qauthor zzm 

#y 

public class JavaClassExecuter { 
/% 









* 执行 外 部 传 过 来 的 代表 一 个 Java 类 的 Byte 数 组 <br> 
* 将 输入 类 的 byte 数 组 中 代表 java.1ang.System 的 CONSTANT Utf8 info 常 量 修改 为 动 持 后 的 HackSystem 类 
* 执行 方法 为 该 类 的 static main (String[] args) 方 法 ， 输 一 结果 为 该 类 向 System.out/err 输 出 的 信息 
* Q@param classByte 代表 一 个 Java 类 的 Byte 数 组 
* @return 执行 结果 
yp 
public static String execute (byte[] classByte) { 
HackSystem.clearBuffer (); 
ClassModifier cm = new ClassModifier(classByte); 
byte[] modiBytes = cm.modifyUTF8Constant ("java/lang/System", "org/fenixsoft/classloading/execute/HackSystem"); 
HotSwapClassLoader loader = new HotSwapClassLoader (); 
Class clazz = loader.loadByte (modiBytes); 
try { 
Method method = clazz.getMethod ("main", new Class[] { String[].class }); 
method.invoke (null, new String[] { null }); 
} catch (Throwable e) { 
e.PrintStackTrace (HackSystem.out); 
} 
return HackSystem.getBufferString ()7 
} 
9.3.4 验证 





远程 执行 功能 的 编码 到 此 就 完成 了 ， 接 下 来 就 来 检验 一 下 我 们 的 劳动 成 果 。 只 是 作为 测试 的 话 ， 任 意 写 一 个 java 类 ， 内 容 无 所 谓 ， 只 要 向 System.out 输 出 信息 即 可 ， 取 名 为 TestClass， 放 到 服务 器 C 盘 
的 根 目录 中 。 然 后 建立 一 个 JSP 文 件 写 上 如 代码 清单 9-8 所 示 的 内 容 ， 就 可 以 在 浏览 器 中 看 到 这 个 类 的 运行 结果 了 。 


代码 清单 9-8 测试 JSP 





<%@ page import="java.lang.*" %> 
<%@ page import="java.io.*" %> 
<%@ page import="org.fenixsoft.classloading.execute.*" 名 > 
< 多 
InputStream is = new FileInputStream("c:/TestClass.class"); 
byte[] b = new byte[is.available()]7 
is.read(b); 
is.close(); 
out.println("<textarea style='width:1000;height=800'>"); 
out .Println (JavaClassExecuter .execute (b) ) 7 
out .Println ("</textarea>") 7 
多 > 






































当然 ， 上 面 的 做 法 只 是 用 于 测试 和 演示 ， 实 际 使 用 这 个 JavaExecuter 执 行 器 的 时 候 ， 如 果 还 要 手工 复制 一 个 Class 文 件 到 服务 器 上 就 没有 什么 意义 了 。 笔 者 给 这 个 执行 器 写 了 一 个 “外 壳 ”， 是 一 个 
Eclipse 插件 ， 可 以 把 Java 文 件 编译 后 传输 到 服务 器 中 ， 然 后 把 执行 器 的 返回 结果 输出 到 Eclipse 的 Console 窗 口 里 ， 这 样 就 可 以 在 有 灵感 的 时 候 随时 写 几 行 调试 代码 ， 放 到 测试 环境 的 服务 器 上 立即 运行 了 。 
实现 虽然 简单 ， 但 效果 很 不 错 ， 对 调试 问题 非常 有 用 ， 如 图 9-4 所 示 。 
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加 build.prop 在 服务 器 上 运行 Fenix 192. 168. 32. 62 


图 9-4 JavaClassExecutet 的 使 用 


上 Rhino 站 点 : http://www.mozilla.org/thino/ ，Rhino 已 被 收编 入 JDK 1.6 中 。 


9.4 本章 小 结 


本 书 第 6~9 章 介绍 了 (Class 文件 格式 、 类 加 载 及 虚拟 机 执行 引 警 几 部 分 内 容 ， 这 些 内 容 是 虚拟 机 中 必 不 可 少 的 组 成 部 分 ， 了 解 了 虚拟 机 如 何 执行 程序 ， 才 能 更 好 地 理解 怎样 才能 写 出 优秀 的 代码 。 























关于 虚拟 机 执行 子 系统 的 介绍 到 此 为 止 就 结束 了 ， 通 过 这 4 章 的 讲解 ， 我 们 描绘 了 一 个 虚拟 机 应 该 如 何 运 行 Class 文 件 的 概念 模型 。 对 于 具体 到 某 个 虚拟 机 的 实现 ， 为 了 使 实现 简单 清晰 ， 或 者 为 了 更 快 
的 运行 速度 ， 在 虚拟 机 内 部 的 运作 跟 概 念 模型 可 能 会 有 非常 大 的 差异 ， 但 从 最 终 的 执行 结果 来 看 应 该 是 一 致 的 。 从 下 一 章 开 始 ， 我 们 将 探索 虚拟 机 在 语法 上 和 运行 性 能 上 ， 是 如 何 对 程序 编写 做 出 各 种 优化 
的 。 





第 四 部 分 “程序 编译 与 代码 优化 


第 10 章 早期 (编译 期 ) 优化 


第 11 章 ”晚期 (运行 期 ) 优化 


第 10 章 早期 (编译 期 ) 优化 


本 章 主要 内 容 





“ 概述 

“ Javac 编 译 器 

“ Java 语法 糖 的 味道 

' 实战 : 插入 式 注解 处 理 器 


从 计算 机 程序 出 现 的 第 一 天 起 ， 对 效率 的 追逐 就 是 程序 天 生 的 坚定 信仰 ， 这 个 过 程 犹如 一 场 没 有 终点 、 永 不 停 软 的 F1 方 程式 竞赛 ， 程 序 员 是 车 手 ， 技 术 平台 则 是 在 赛 道上 飞驰 的 赛车 。 


10.1 概述 








Java 语 言 的 “编译 期 ”是 一 段 “ 不 确定 ”的 操作 过 程 ， 因 为 它 可 能 是 指 一 个 前 端 编译 器 (其 实 叫 “编译 器 的 前 端 ” 更 准确 一 些 ) 把 *java 文 件 转变 成 :class 文 件 的 过 程 ; 也 可 能 是 指 虚 拟 机 的 后 端 运 行 期 
编译 器 (JIT 编 译 器 ，Just In Time Compiler) 把 字 节 码 转变 成 机 器 码 的 过 程 ; 还 可 能 是 指使 用 静态 提前 编译 器 (AOT 编 译 器 ，Ahead Of Time Compiler) 直接 把 *java 文 件 编译 成 本 地 机 器 代码 的 过 程 。 
下 面 列举 了 这 三 类 编译 过 程 中 一 些 比较 有 代表 性 的 编译 器 : 


























: 前 端 编译 器 : Sun 的 Javac、Eclipse JDT 中 的 增 量 式 编译 器 (ECJ) 山 。 
:JIT 编 译 器 : HotSpot VM 的 C1、C2 编 译 器 。 


" AOT 编 译 器 : GNU Compiler for the Java (GC]J) 癌 、ExcelsiorJETDI。 

















这 三 类 过 程 中 最 符合 大 家 对 Java 程 序 编译 认 知 的 应 该 是 第 一 类 ， 在 本 章 的 后 续 文字 里 ， 笔 者 提 到 的 “编译 期 ”和 “编译 器 ”都 仅 限于 第 一 类 编译 过 程 。 限 制 了 编译 范围 后 ， 对 于 “优化 ”二 字 的 定义 就 
需要 宽松 一 些 ， 因 为 Javac 这 类 编译 器 对 代码 的 运行 效率 几乎 没有 任何 优化 措施 (在 JDK 1.3 之 后 ，Javac 的 -O 优 化 参数 就 不 再 有 意义 ) 。 虚 拟 机 设计 团队 把 对 性 能 的 优化 集中 到 了 后 端的 即时 编译 器 中 ， 这 
样 可 以 让 那些 不 是 由 Javac 产 生 的 Class 文 件 (如 JRuby、Groovy 等 语言 的 Class 文 件 ) 也 同样 能 享受 到 编译 器 优化 所 带 来 的 好 处 。 但 是 Javac 做 了 许多 针对 编码 过 程 的 优化 措施 来 改善 程序 员 的 编码 风格 和 提 
高 编码 效率 。 相 当 多 新 生 的 Java 语 法 特性 ， 都 是 靠 编译 器 的 “语法 糖 ” 来 实现 ， 而 不 是 依赖 虚拟 机 的 底层 改进 来 支持 ， 可 以 说 ，Java 中 即时 编译 器 在 运行 期 的 优化 过 程 对 于 程序 运行 来 说 更 重要 ， 而 前 端 编 
译 器 在 编译 期 的 优化 过 程 对 于 程序 编码 来 说 关系 更 加 密切 。 









































[中 JDT 官方 站 点 : http://www.eclipse.org/jdt/ 。 
四 GCJ 官方 站 点 : http://gcc.gnu.org/java/。 


[3] Excelsior JET 官方 站 点 : http://www.excelsior-usa.com/。 


10.2 Javac 编 译 器 














分 析 源码 是 了 解 一 项 技术 实现 内 幕 的 最 有 效 的 手段 ，Javac 编 译 器 不 像 HotSpot 虚 拟 机 那样 使 用 C+ + 语言 (包含 少量 语言 ) 实现 ， 它 本 身 就 是 一 个 由 Java 语 言 编写 的 程序 ， 这 为 纯 Java 的 程序 员 了 解 它 
的 编译 过 程 带 来 了 很 大 的 便利 。 








10.2.1 Javac 的 源码 与 调试 














Javac 的 源码 存放 在 JDK_SRC_HOME/langtools/src/share/classes/com/sun/tools/javac 中 1], 除了 JDK 自 身 的 API 外 ， 就 只 引用 了 JDK_SRC_HOME/langtools/src/share/classes/com/sun/* 里 面 的 
代码 ， 所 以 调试 环境 建立 起 来 简单 方便 ， 基 本 上 不 需要 处 理 依赖 关系 。 





























以 Eclipse IDE 环 境 为 例 ， 先 建立 一 个 名 为 “Compiler javac” 的 Java 工 程 ， 然 后 把 JDK_SRC_HOME/langtools/src/share/classes/com/sun/* 目 录 下 的 源 文件 全 部 拷贝 到 工程 的 源码 目录 中 ， 如 图 10- 
1 所 示 。 























导入 代码 期 间 ， 源 码 文件 “AnnotationProxyMaker.java” 可 能 会 提示 “Access Restriction”， 被 Eclipse 拒 绝 编 译 ， 如 图 10-2 所 示 。 


>》 javado 
> 3 mirror 
》 和 source 
> 1 tools 
> org 
. Classpath 
.Project 


Cc 





图 10-1 Eclipse 中 的 Javac 工 程 


/** 


* Returns a dynamic proxy for an annotation mirror. 


*/ 


private Annotation generateAnnotation() { 
return AnnotatiohParser -nnota tionForMap (annoType. 


‘Access restriction: The method annotationForlMap (Class, Nap<String, Object>) 
} ArmotatiorParser 15 not accessible due to restriction on required library 


D:\_ DevSspace\jdkl.6.0 21\jre\lib\rt. jar 


/** 


图 10-2 AnnotationProxyMaker 被 拒绝 编译 





这 是 由 于 Eclipse 的 JRE System Library 中 默认 包含 了 一 系列 的 代码 访问 规则 (Access Rules) ， 如 果 代 码 中 引用 了 这 些 访问 规则 所 禁止 引用 的 类 ， 就 会 提示 这 个 错误 。 可 以 通过 添加 一 条 允许 访问 Jar 包 


中 所 有 类 的 访问 规则 来 解决 这 个 问题 ， 如 图 10-3 所 示 。 








导入 了 Javac 的 源码 后 ， 就 可 以 运行 com.sun.toolsjavac.Main 的 main() 方 法 来 执行 编译 了 ， 与 命令 行 中 使 有 





有 Javac 的 命令 没有 什么 








中 的 “Arguments” 页 签 中 指定 。 





区 别 ， 编 译 的 文件 与 参数 在 Eclipse 的 “Debug Configurations” 面 板 





虚拟 机 规范 严格 定义 了 Class 文 件 的 格式 ， 但 是 对 如 何 把 Java 源 码 文件 转变 为 Class 文 件 的 编译 过 程 未 作 任何 定义 ， 所 以 这 部 分 内 容 是 与 具体 JDK 实 现 相关 的 。 从 Sun Javac 的 代码 来 看 ， 编 译 过 程 大致 可 


以 分 为 三 个 过 程 ， 分 别 是 : 
“ 解析 与 填充 符号 表 过 程 。 


“ 插入 式 注解 处 理 器 的 注解 处 理 过 程 。 


: 分 析 与 字 节 码 生 成 过 程 。 


这 三 个 步骤 之 间 的 关系 与 交互 顺序 如 图 10-4 所 示 。 










Java Build Path 


BM Libraries | 0 Order and Export 


JARs and class folders on the build path: 
BE JRE System Library [JavaSE-1.6] 





ee 
yment descriptc 





















Add TARs... 











d Path BE Access rules: 1 rules(s) defined, added to 说 
Style 52 Jatiyve library location: (None) | Add External JARs... 
iler 








上 Add Variable... 











Add Library. . . 












Add Class Folder... 












Specify access rules for the library ' JRE System Library 
[JavaSE-1.6]’. 

When accessing a type ln a library child entry, these rules are 
processed top down until a rule pattern matches. When no pattern 
matches, the rules defined for library child entry are taken. 


















Access rules: 























10-3 设置 访问 规则 








分 析 与 字 节 码 生 成 
Analyse and Generate 





图 10-4 Javac 的 编译 过 程 中 


Javac 编 译 动作 的 入 口 是 com.sun.toolsjavac.main.JavaCompiler 类 ， 上 述 三 个 过 程 的 代码 逻辑 集中 在 这 个 类 的 compile0 和 compile2() 方 法 里 ， 其 中 主体 代码 如 图 10-5 所 示 ， 整 个 编译 最 关键 的 处 理 就 
由 图 中 标注 的 8 个 方法 来 完成 ， 下 面 我 们 具体 看 一 下 这 8 个 方法 实现 了 什么 功能 。 


一 一 > 准备 过 程 : 初始 化 括 入 式 注解 处 理 器 


// These method calls must be chained to avoid memory leaks 
delegateCompiler = 

processAnnotations| 一 一 >- 过 程 2 : 执行 注解 处 理 

lenterTreesl(stopIfError (CompileState. PARSE,-»>— 过 程 1.2: 输入 到 符号 表 
parseFilesl(sourceFileObjects)))， 9- 过 程 1.1: 词法 分 析 、 语 法 分 析 


classnames); 















delegateCompiler.compile2 () ; 一 一 一 > 过 程 3: 分 析 及 字 节 玛 生 成 


case BY TODO: 
while ('todo.isEmpty!()) 





| lattributel(todo. remove ())))); 


过 程 3. 4 : 生成 字 节 码 ”过 程 3.3 : 解 语法 糖 ” 过 程 3.2 : 数据 流 分 析 ”过 程 3.1 : 标注 
图 10-5 Javac 编 译 过 程 的 主体 代码 


10.2.2 解析 与 填充 符号 表 


解析 步骤 由 图 10-5 中 的 parseFiles( 方 法 (图 中 的 过 程 1.1) 完成 ， 解 析 步 又 包括 了 经 典 程序 编译 原理 中 的 词法 分 析 和 语法 分 析 两 个 过 程 。 








1. 词 法 、 语 法 分 析 








词法 分 析 是 将 源 代码 的 字符 流转 变 为 标记 (Token) 集合 ， 单 个 字符 是 程序 编写 过 程 的 最 小 元 素 ， 而 标记 则 是 编译 过 程 的 最 小 元 素 ， 关 键 字 、 变 量 名 、 字 面 量 和 运算 符 都 可 以 成 为 标记 ， 如 “int 
a=b+2” 这 名 代码 包含 了 6 个 标记 ， 分 别 是 int、a、=、b、+、2， 虽 然 关键 字 int 由 三 个 字符 构成 ， 但 是 它 只 是 一 个 Token， 不 可 再 拆 分 。 在 Javac 的 源码 中 ， 词 法 分 析 过 程 由 


com.sun.toolsjavac.parser.Scanner 类 来 实现 。 





语法 分 析 是 根据 Token 序 列 来 构造 抽象 语法 树 的 过 程 ， 抽 象 语法 树 (AST，Abstract Syntax Tree) 是 一 种 用 来 描述 程序 代码 语法 结构 的 树 形 表示 方式 ， 语 法 树 的 每 一 个 节点 都 代表 着 程序 代码 中 的 一 个 
语法 结构 (Construct) ， 例 如 包 、 类 型 、 修 饰 符 、 运 算 符 、 接 口 、 返 回 值 甚 至 连 代码 注释 等 都 可 以 是 一 个 语法 结构 。 








图 10-6 是 Eclipse AST View 揪 件 分 析出 来 的 某 段 代码 的 抽象 语法 树 视图 ， 读 者 可 以 通过 这 张 图 对 抽象 语法 树 有 一 个 直观 的 认识 。 在 Javac 的 源码 中 ， 语 法 分 析 过 程 由 com.sun.tools.javac.parser.Parser 
类 来 实现 ， 这 个 阶段 产 出 的 抽象 语法 树 由 com.sun.toolsjavac.tree.JCTree 类 来 表示 ， 经 过 这 个 步骤 之 后 ， 编 译 器 就 基本 不 会 再 对 源码 文件 进行 操作 了 ， 后 续 的 操作 都 建立 在 抽象 语法 树 之 上 。 




















f 屿 Package Explorer os. Havi 2ator Eh Ti 本 su 


FortRedirectSeryer, java [AST Level 3). Creation time: lB ms. = 


» PhACERMGE 
» INMFORTS (8) 
a TYFES (1) 
a TypeDeclaration [342, 1493] 
» > type bindine: org. fenixsoft. net. PortRedirectServer 
JAVADDE : rmmll 
MODIFIERS (1) 
INTERFACE: "false’ 
HAME 
TYFE FAFAMETERS IO) 
SUFERCLASS_TYFE: mull 
SUPER_ INIERFACE TYFES (1) 
BODY DECLARATIONS (5S) 
» FieldDneclaration [397, 32] 
» Fieldlheclaration [434, 75] 
》 ethodDeclaration [S51i4, 1131] 
> Methodheclaration [1650, 75] 
» ethodDeclaration [1730，102] 
> CompilationUnit: orge. fenixsoft. net. FortRedirectServer. ]ava 
;comments [5) 
> compliler problems IO) 
» 2 AST settines 
» > RESOLYE WELL FNOWHN_TYPES 





图 10-6 ”抽象 语法 树 结 构 视图 


2. 填 充 符号 表 


完成 了 语法 分 析 和 词法 分 析 之 后 ， 下 一 步 就 是 填充 符号 表 的 过 程 ， 也 就 是 图 10-5 中 enterTrees0 方 法 (图 中 的 过 程 1.2) 所 做 的 事情 。 符 号 表 (Symbol Table) 是 由 一 组 符号 地 址 和 符号 信息 构成 的 表 
格 ， 读 者 可 以 把 它 想象 成 哈 希 表 中 K-V 值 对 的 形式 (实际 上 符号 表 不 一 定 是 哈 希 表 实 现 ， 可 以 是 有 序 符号 表 、 树 状 符号 表 和 栈 结构 符号 表 等 ) 。 符 号 表 中 所 登记 的 信息 在 编译 的 不 同 阶段 都 要 用 到 。 在 语义 
分 析 中 ， 符 号 表 所 登记 的 内 容 将 用 于 语义 检查 (如 检查 一 个 名 字 的 使 用 和 原先 的 说 明 是 否 一 致 ) 和 产生 中 间 代 码 。 在 目标 代码 生成 阶段 ， 当 对 符号 名 进行 地 址 分 配 时 ， 符 号 表 是 地 址 分 配 的 依据 。 

















在 Javac 源 代码 中 ， 填 充 符号 表 的 过 程 由 com.sun.toolsjavac.comp.Enter 类 实现 ， 此 过 程 的 出 口 是 一 个 待 处 理 列表 (To Do List) ， 包 含 了 每 一 个 编译 单元 的 抽象 语法 树 的 顶级 节点 ， 以 及 package- 


10.2.3 ”注解 处 理 器 














JDK 1.5 之 后 ，Java 语 言 提供 了 对 注解 (Annotations) 的 支持 ， 这 些 注解 与 普通 的 Java 代 码 一 样 ， 是 在 运行 期 间 发 挥 作用 的 。 在 JDK 1.6 中 实现 了 JSR-269 规 范 Bl， 提 供 了 一 组 插入 式 注解 处 理 器 的 标准 
API 在 编译 期 间 对 注解 进行 处 理 ， 我 们 可 以 把 它 看 做 是 一 组 编译 器 的 插件 ， 在 这 些 插件 里 面 ， 可 以 读 取 、 修 改 、 添 加 抽象 语法 树 中 的 任意 元 素 。 如 果 这 些 插件 在 处 理 注 解 期 间 对 语法 树 进 行 了 修改 ， 那 么 编译 
器 将 回 到 解析 及 填充 符号 表 的 过 程 重新 处 理 ， 直 到 所 有 的 插入 式 注解 处 理 器 都 没有 再 对 语法 树 进行 修改 为 止 ， 每 一 次 循环 称 为 一 个 Round， 也 就 是 上 文中 图 10-4 的 那个 回环 过 程 。 






























































有 了 编译 器 注解 处 理 的 标准 API 后 ， 我 们 的 代码 才 有 可 能 干涉 编译 器 的 行为 ， 由 于 语法 树 中 的 任意 元 素 ， 甚 至 包括 代码 注释 都 可 以 在 插件 之 中 访问 到 ， 所 以 通过 插入 式 注解 处 理 器 实现 的 插件 在 功能 上 有 
很 大 的 发 挥 空间 。 只 要 有 足够 的 创意 ， 程 序 员 可 以 使 用 插入 式 注解 处 理 器 来 实现 许多 原本 只 能 在 编码 中 完成 的 事情 ， 本 章 最 后 有 一 个 使 用 插入 式 注解 处 理 器 的 简单 实战 。 




































































在 Javac 源 码 中 ， 插 入 式 注解 处 理 器 的 初始 化 过 程 是 在 initPorcessAnnotations() 方 法 中 完成 的 ， 而 它 的 执行 过 程 则 是 在 processAnnotations() 方 法 中 完成 的 ， 这 个 方法 判断 是 否 还 有 新 的 注解 处 理 器 需 
执行 ， 如 果 有 的 话 ， 则 通过 com.sun.tools.javac.processing.JavacProcessingEnvironment 类 的 doProcessing() 方 法 生成 一 个 新 的 JavaCompiler 对 象 对 编译 的 后 续 步 又 进行 处 理 。 








10.2.4 ”语义 分 析 与 字 节 码 生成 








语法 分 析 之 后 ， 编 译 器 获得 了 程序 代码 的 抽象 语法 树 表示 ， 语 法 树 能 表示 一 个 结构 正确 的 源 程序 的 抽象 ， 但 无 法 保证 源 程序 是 符合 逻辑 的 。 而 语义 分 析 的 主要 任务 是 对 结构 上 正确 的 源 程序 进行 上 下 文 
有 关 性 质 的 审查 ， 如 进行 类 型 审查 。 举 个 例子 ， 假 设 有 如 下 的 三 个 变量 定义 语句 : 











int a= 1; 
boolean b = false; 
char C = 2; 





后 续 可 能 出 现 的 赋值 运算 如 下 : 


d=atc; 
d=b+te; 


a 
int b 
char d=a+t+c; 























后 续 代码 中 如 果 出 现 了 如 上 三 种 赋值 运算 的 话 ， 那 它们 都 能 构成 结构 正确 的 语法 树 ， 但 是 只 有 第 一 种 的 写法 在 语义 上 是 没有 问题 的 ， 能 够 通过 编译 ， 其 余 两 种 在 Java 语 言 中 是 不 合 逻辑 的 ， 无 法 编译 
(是 否 合乎 语义 逻辑 必须 限定 在 具体 的 语言 与 具体 的 上 下 文 环境 之 中 才 有 意义 。 如 在 C 语 言 中 ，a、b、c 的 上 下 文 定义 不 变 ， 第 二 、 三 种 写法 都 是 可 以 被 正确 编译 的 ) 。 












































1. 标 注 检查 














Javac 的 编译 过 程 中 ， 语 义 分 析 过 程 分 为 标注 检查 和 数据 及 控制 流 分 析 两 个 步骤 ， 分 别 由 图 10-5 的 attribute0 和 flow() 方 法 (分别 对 应 图 中 的 过 程 3.1 和 过 程 3.2) 完成 。 



































标注 检查 步骤 检查 的 内 容 包括 诸如 变量 使 用 前 是 否 已 被 声明 、 变 量 与 赋值 之 间 的 数据 类 型 是 否 能 够 匹配 ， 等 等 。 在 标注 检查 步骤 中 ， 还 有 一 个 重要 的 动作 称 为 常量 折 晋 ， 如 果 我 们 在 代码 中 写 了 如 下 定 
义 : 




















int a=1+2; 














在 语法 树 上 仍然 能 看 到 字面 量 “1”、“2” 和 操作 符 “+” 号 ,但 是 在 经 过 常量 折 革 之 后 ， 它 们 将 会 被 折 夫 为 字面 量 “3”， 如 图 10-7 所 示 ， 这 个 插入 式 表达 式 (Infix Expression) 的 值 已 经 在 语法 树 
上 标注 出 来 了 (ConstantExpressionValue: 3) 。 由 于 编译 期 间 进行 了 常量 折 双 ， 所 以 在 代码 里 面 定义 “a=1+2” 比 起 直接 定义 “a=3”， 并 不 会 增加 程序 运行 期 哪怕 仅仅 一 个 CPU 指 令 的 运算 量 。 


























标注 检查 步骤 在 Javac 源 码 中 的 实现 类 是 com.sun.tools.javac.comp.Attr 类 和 com.sun.tools.javac.comp.Check 类 。 
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10-7 常量 折 过 





2 数据 及 控制 流 分 析 





数据 及 控制 流 分 析 是 对 程序 上 下 文 逻辑 更 进一步 的 验证 ， 它 可 以 检查 出 诸如 程序 局 部 变量 在 使 用 前 是 否 有 赋值 、 方 法 的 每 条 路 径 是 否 都 有 返回 值 、 是 否 所 有 的 受 查 异 常 都 被 正确 处 理 了 等 问题 。 编 译 时 
期 的 数据 及 控制 流 分 析 与 类 加 载 时 的 数据 及 控制 流 分 析 的 目的 基本 上 是 一 致 的 ， 但 校 验 范围 有 所 区 别 ， 有 一 些 校 验 项 只 有 在 编译 期 或 运行 期 才能 进行 。 下 面 举 一 个 关于 final 修 饰 符 的 数据 及 控制 流 分 析 的 例 
子 ， 见 代码 清单 10-1 所 示 。 





代码 清单 10-1 final 语义 校 验 





// 方法 一 带 有 final 修 饰 

Public void foo (final int arg) { 
final int var = 07 
// do something 

} 

// 方法 二 没有 final 修 饰 

public void foo (int arg) { 


int var = 0; 
// do something 

















这 两 个 foo() 方 法 中 ， 一 个 方法 的 参数 和 局 部 变量 定义 使 用 了 final 修 饰 符 ， 另 外 一 个 则 没有 ， 在 代码 编写 时 程序 肯定 会 受到 final 修 饰 符 的 影响 ， 不 能 再 改变 arg 和 Var 变量 的 值 ， 但 是 这 两 段 代码 编译 出 来 
的 Class 文 件 是 没有 任何 一 点 区 别 的 ， 通 过 第 6 章 的 讲解 我 们 已 经 知道 ， 局 部 变量 与 字段 (实例 变量 、 类 变量 ) 是 有 区 别 的 ， 它 在 常量 池 中 没有 CONSTANT _Fieldref_info 的 符号 引用 ， 自 然 就 没有 访问 标志 












































(Access Flags) 的 信息 ， 甚 至 可 能 连 名 称 都 不 会 被 保留 下 来 (取决 于 编译 时 的 选项 ) ， 自 然 在 Class 文 件 中 不 可 能 知道 一 个 局 部 变量 是 不 是 被 声明 为 final 了 。 因 此 ， 将 局 部 变量 声明 为 final， 对 运行 期 是 没 
有 影响 的 ， 变 量 的 不 变性 仅仅 由 编译 器 在 编译 期 间 保障 。 在 Javac 的 源码 中 ， 数 据 及 控制 流 分 析 的 入 口 是 图 10-5 中 的 flow() 方 法 (图 中 的 过 程 3.2) ， 具 体操 作 由 com.sun.toolsjavac.comp.Flow 类 来 完成 。 









































3. 解 语法 糖 











语法 糖 (Syntactic Sugar) ， 也 称 糖衣 语法 ， 是 由 英国 计算 机 科学 家 彼得 约翰 : 兰 达 (Peter J.Landin) 发 明 的 一 个 术语 ， 指 在 计算 机 语言 中 添加 的 某 种 语法 ， 这 种 语法 对 语言 的 功能 并 没有 影响 ， 但 是 
更 方便 程序 员 使 用 。 通 常 来 说 使 用 语法 糖 能 够 增加 程序 的 可 读 性 ， 从 而 减少 程序 代码 出 错 的 机 会 。 
















































































Java 在 现代 编程 语言 之 中 属于 “低糖 语言 ” (相对 于 C# 及 许多 其 他 JVM 语 言 来 说 ) ， 尤 其 是 JDK 1.5 之 前 的 版 本 ，“ 低 糖 ” 语 法 也 是 Java 语 言 被 怀疑 已 经 “落后 ”的 一 个 表面 理由 。Java 中 最 常用 的 语 
法 糖 主要 是 前 面 提 到 过 的 泛 型 ( 泛 型 并 不 一 定 都 是 语法 糖 实现 ， 如 C# 的 泛 型 就 是 直接 由 CLR 支 持 的 ) 、 变 长 参数 、 自 动 装 箱 拆 箱 ， 等 等 ， 虚 拟 机 运行 时 不 支持 这 些 语 法 ， 它 们 在 编译 阶段 被 还 原 回 简单 的 基 
础 语法 结构 ， 这 个 过 程 就 称 为 解 语法 糖 。Java 的 这 些 语法 糖 被 解除 后 是 什么 样子 ， 将 在 下 一 节 中 详细 讲述 。 













































































在 Javac 的 源码 中 ， 解 语法 糖 的 过 程 由 desugar() 方 法 触发 ， 在 com.sun.toolsjavac.comp.TransTypes 类 和 com.sun.toolsjavac.comp.Lower 类 中 完成 。 


4. 字 节 码 生 成 





字 节 码 生成 是 Javac 编 译 过 程 的 最 后 一 个 阶段 ， 在 Javac 源 码 里 面 由 com.sun.tools.javac.jvm.Gen 类 来 完成 。 字 节 码 生成 阶段 不 仅仅 是 把 前 面 各 个 步骤 所 生成 的 信息 (语法 树 、 符 号 表 ) 转化 成 字 节 码 写 
到 磁盘 中 ， 编 译 器 还 进行 了 少量 的 代码 添加 和 转换 工作 。 





























例如 前 面 章节 中 多 次 提 到 的 实例 构造 器 <init> () 方 法 和 类 构造 器 <clinit> (方法 就 是 在 这 个 阶段 被 添加 到 语法 树 之 中 的 (请 注意 这 里 的 实例 构造 器 并 不 是 指 默 认 构 造 函 数 ， 如 果 用 户 代码 中 没有 提供 任何 
构造 函数 ， 那 编译 器 将 会 添加 一 个 没有 参数 的 、 访 问 性 (public、protected 或 private) 与 当前 类 一 致 的 默认 构造 函数 ， 这 个 工作 在 填充 符号 表 阶 段 就 已 经 完成 ) ， 这 两 个 构造 器 的 产生 过 程 实际 上 是 一 个 
代码 收敛 的 过 程 ， 编 译 器 会 把 语句 块 (对 于 实例 构造 器 而 言 是 “{” 块 ， 对 于 类 构造 器 而 言 是 “static{}” 块 ) 、 变 量 初始 化 (实例 变量 和 类 变量 ) 、 调 用 父 类 的 实例 构造 器 ( 仪 仅 是 实例 构造 器 ，<clinit>() 
方法 中 无 须 调 用 父 类 的 <clinit> () 方 法 ， 虚 拟 机 会 自动 保证 父 类 构造 器 的 执行 ， 但 在 <clinit> () 方 法 中 经 常会 生成 调用 java.lang.Object 的 <init> (方法 的 代码 ) 等 操作 收敛 到 <init> 0 和 <clinit> () 方 法 之 中 ， 
并 且 保 证 一 定 是 按 先 执行 父 类 的 实例 构造 器 ， 然 后 初始 化 变量 ， 最 后 执行 语句 块 的 顺序 进行 ， 上 面 所 述 的 动作 由 Gen.normalizeDefs() 方 法 来 实现 。 除 了 生成 构造 器 以 外 ， 还 有 其 他 的 一 些 代码 蔡 换 工作 上 
优化 程序 的 实现 逻辑 ， 如 把 字符 串 的 加 操作 蔡 换 为 StringBuffer 或 stringBuilder (取决 于 目标 代码 的 版 本 是 否 大 于 或 等 于 JDK 1.5) 的 append() 操 作 ， 等 等 。 








































































































完成 了 对 语法 树 的 遍历 和 调整 之 后 ， 就 会 把 填充 了 所 有 所 需 信息 的 符号 表 交 到 com.sun.toolsjavacjvm.ClassWriter 类 手 上 ， 由 这 个 类 的 writeClass() 方 法 输出 字 节 码 ， 生 成 最 终 的 Class 文 件 ， 到 此 为 止 
整个 编译 过 程 宣告 结束 。 











目 如 何 获取 OpenJDK 源码 请 参考 本 书 第 1 章 。 
[中 图 片 来 源 : http://openjdk.java.net/groups/compiler/doc/compilation-overview/index.html， 本 书 对 该 图 做 了 汉化 处 理 。 
[3]JSR-269 : Pluggable Annotations Processing API ( 插入 式 注解 处 理 API) 。 


10.3 ”Java 语 法 糖 的 味道 








几乎 各 种 语言 或 多 或 少 都 提供 过 一 些 语法 糖 来 方便 程序 员 的 代码 开发 ， 这 些 语法 糖 虽 然 不 会 提供 实质 性 的 功能 改进 ， 但 是 它们 或 能 提高 效率 ， 或 能 提升 语法 的 严谨 性 ， 或 能 减少 编码 出 错 的 机 会 。 不 过 
也 有 一 种 观点 认为 语法 糖 并 不 一 定 都 是 有 益 的 ， 大 量 添加 和 使 用 含 糖 的 语法 容易 让 程序 员 产 生 依赖 ， 无 法 看 清 语法 糖 的 糖衣 背后 程序 代码 的 真实 面目 。 
































总 而 言 之 ， 语 法 糖 可 以 看 做 是 编译 器 实现 的 一 些 “ 小 把 戏 ”， 这 些 “ 小 把 戏 ” 可 能 会 使 得 效率 有 一 个 “大 提升 ”， 但 我 们 也 应 该 去 了 解 这 些 “ 小 把 戏 ” 背 后 的 真实 世界 ， 那 样 才能 利用 好 它们 ， 而 不 是 
被 它们 所 迷惑 。 

















10.3.1 ” 泛 型 与 类 型 擦 除 




















泛 型 是 JDK 1.5 的 一 项 新 特性 ， 它 的 本 质 是 参数 化 类 型 (Parameterized Type) 的 应 用 ， 也 就 是 说 所 操作 的 数据 类 型 被 指定 为 一 个 参数 。 这 种 参数 类 型 可 以 用 在 类 、 接 口 和 方法 的 创建 中 ， 分 别称 为 泛 
型 类 、 泛 型 接口 和 泛 型 方法 。 





泛 型 思想 早 在 C++ 语言 的 模板 (Templates) 中 就 开始 生根 发 芽 ， 在 java 语言 还 没有 出 现 泛 型 时 ， 只 能 通过 Object 是 所 有 类 型 的 父 类 和 类 型 强制 转换 两 个 特点 的 配合 来 实现 类 型 泛 化 。 例 如 在 哈 希 表 的 
存 取 中 ，JDK 1.5 之 前 使 用 HashMap 的 get() 方 法 ， 返 回 值 就 是 一 个 Object 对 象 ， 由 于 java 语言 里 面 所 有 的 类 型 都 继承 于 java.lang.Object， 那 Object 转型 成 任何 对 象 都 是 有 可 能 的 。 但 是 也 因为 有 无 限 的 可 
能 性 ， 就 只 有 程序 员 和 运行 期 的 虚拟 机 才 知道 这 个 Object 到 底 是 个 什么 类 型 的 对 象 。 在 编译 期 间 ， 编 译 器 无 法 检查 这 个 Object 的 强制 转型 是 否 成 功 ， 如 果 仅 仅 依 赖 程序 员 去 保障 这 项 操作 的 正确 性 ， 许 多 
ClassCastException 的 风险 就 会 被 转嫁 到 程序 运行 期 中 。 





















































泛 型 技术 在 C# 和 Java 之 中 的 使 用 方式 看 似 相 同 ， 但 实现 上 却 有 着 根本 性 的 分 上 层 ，C# 里 面 泛 型 无 论 在 程序 源码 中 、 编 译 后 的 lL 中 (Intermediate Language， 中 间 语 言 ， 这 时 候 泛 型 是 一 个 占 位 符 ) 还 是 
运行 期 的 CLR 中 都 是 切实 存在 的 ，List<int> 与 List<String> 就 是 两 个 不 同 的 类 型 ， 它 们 在 系统 运行 期 生成 ， 有 自己 的 虚 方 法 表 和 类 型 数据 ， 这 种 实现 称 为 类 型 膨胀 ， 基 于 这 种 方法 实现 的 泛 型 被 称 为 真实 泛 
型 。 








Java 语 言 中 的 泛 型 则 不 一 样 ， 它 只 在 程序 源码 中 存在 ， 在 编译 后 的 字 节 码 文件 中 ， 就 已 经 被 替换 为 原来 的 原生 类 型 (Raw Type， 也 称 为 裸 类 型 ) 了 ， 并 且 在 相应 的 地 方 插 入 了 强制 转型 代码 ， 因 此 对 于 
运行 期 的 Java 语 言 来 说 ，ArrayList<int> 与 ArrayList<String> 就 是 同一 个 类 。 所 以 说 泛 型 技术 实际 上 是 Java 语 言 的 一 颗 语 法 糖 ，Java 语 言 中 的 泛 型 实现 方法 称 为 类 型 擦 除 ， 基 于 这 种 方法 实现 的 泛 型 被 称 为 
伪 泛 型 。 
































代码 清单 10-2 是 一 段 简单 的 Java 泛 型 例子 ,我 们 可 以 看 一 下 它 编译 后 的 结果 是 怎样 的 ? 








代码 清单 10-2 泛 型 擦 除 前 的 例子 


public static void main(String[] args) { 
Map<String, String> map = new HashMap<String, String>(); 
map.put ("hello"，" 你 好 ") 7 
map.put ("how are You?"，" 吃 了 没 ? ") ; 
System.out .Println (map.get ("hello")); 
System.out .Println (map.get ("how are You?") ) 7 





























把 这 段 Java 代 码 编译 成 Class 文 件 ， 然 后 再 用 字 节 码 反 编译 工具 进行 反 编译 后 ， 将 会 发 现 泛 型 都 不 见 了 ， 程 序 又 变 回 了 Java 泛 型 出 现 之 前 的 写法 ， 泛 型 类 型 都 变 回 了 原生 类 型 ， 如 代码 清单 10-3 所 示 。 






































代码 清单 10-3 ” 泛 型 擦 除 后 的 例子 





public static void main (String[] args) { 


Map map = new HashMap(); 

map.put ("hello",， "你 好 "); 

map.put ("how are you?",，" 乃 了 没 ? "); 
System.out.println( (String) map.get ("hello")); 
System.out .println( (String) map.get ("how are you?")); 























当初 JDK 设 计 团队 为 什么 选择 类 型 擦 除 的 方式 来 实现 Java 语 言 的 泛 型 支持 呢 ? 是 因为 实现 简单 、 兼 容 性 考虑 还 是 别 的 原因 ? 我 们 已 不 得 而 知 ， 但 确实 有 不 少 人 对 Java 语 言 提供 的 伪 泛 型 颇 有 微 词 ， 当 时 
甚至 连 《Thinking In Java》 一 书 的 作者 Bruce Eckel 也 发 表 了 一 篇 文章 《这 不 是 泛 型 ! 》['] 来 批评 JDK 1.5 中 的 泛 型 实现 。 
































当时 众多 的 批评 之 中 ， 有 一 些 是 比较 表面 的 ， 还 有 一 些 从 性 能 上 说 泛 型 会 由 于 强制 转型 操作 和 运行 期 缺少 针对 类 型 的 优化 等 原因 从 而 导致 比 C# 的 泛 型 慢 一 些 ， 则 是 完全 偏离 了 方向 ， 姑 上 且 不 论 Java 泛 型 
是 不 是 真 的 会 比 C# 泛 型 慢 ， 选 择 从 性 能 的 角度 上 评价 用 于 提升 语义 准确 性 的 泛 型 思想 ， 就 犹如 在 讨论 刘翔 打 斯 诺 克 的 水 平 与 丁俊晖 有 多 大 的 差距 一 般 。 但 笔者 也 并 非 在 为 Java 的 泛 型 辩护 ， 它 在 某 些 场景 下 
确实 存在 不 足 ， 笔 者 认为 通过 擦 除法 来 实现 泛 型 丧失 了 泛 型 思想 一 些 应 有 的 优雅 ， 例 如 下 面 代码 清 单 10-4 的 例子 。 























代码 清单 10-4” 当 泛 型 遇见 重 载 1 


public class GenericTypes { 
public static void method (List<String> list) { 
System.out .println ("invoke method (List<String> list)"); 
} 
public static void method (List<Integer> list) { 
System.out .println("invoke method (List<Integer> list)"); 
} 


请 想 一 想 ， 上 面 这 段 代码 是 否 正确 ， 能 否 编译 执行 ? 也 许 您 已 经 有 了 答案 ， 这 段 代码 是 不 能 被 编译 的 ， 是 因为 参数 List<Integer> 和 List<String> 编 译 之 后 都 被 擦 除了 ， 变 成 了 一 样 的 原生 类 型 
List<E> ， 擦 除 动作 导致 这 两 个 方法 的 特征 签名 变 得 一 模 一 样 。 初 步 看 来 ， 无 法 重 载 的 原因 已 经 找到 了 ， 但 是 真 的 就 是 如 此 吗 ? 只 能 说 ， 泛 型 擦 除 成 相同 的 原生 类 型 只 是 无 法 重 载 的 一 部 分 原因 ， 请 青 接着 看 
一 看 代码 清单 10-5 中 的 内 容 。 

































































代码 清单 10-5” 当 泛 型 遇见 重 载 2 


public class GenericTypes { 

public static String method (List<String> list) { 
System.out .Println("invoke method (List<String> list)"); 
return ""; 

} 

public static int method(List<Integer> list) { 
System.out .println ("invoke method (List<Integer> list)"); 
return 1; 


} 

public static void main (String[] args) { 
method (new ArrayList<String>()); 
method (new ArrayList<Integer>()); 


invoke method (List<String> 1ist) 
invoke method (List<Integer> list) 





























代码 清单 10-5 与 代码 清单 10-4 的 差别 ， 是 两 个 method 方 法 添加 了 不 同 的 返回 值 ， 由 于 这 两 个 返回 值 的 加 入 ， 方 法 重 载 居 然 成 功 了 ， 即 这 段 代码 可 以 被 编译 和 执行 操 了 。 这 是 我 们 对 java 语言 中 返回 值 
不 参与 重 载 选 择 的 基本 认 知 的 挑战 吗 ? 























代码 清单 10-5 中 的 重 载 当然 不 是 根据 返回 值 来 确定 的 ， 之 所 以 这 次 能 编译 和 执行 成 功 ， 是 因为 两 个 nehtod() 方 法 加 入 了 不 同 的 返回 值 后 才能 共存 在 一 个 Class 文 件 之 中 。 第 6 章 介绍 Class 文 件 方法 表 
(method info) 的 数据 结构 时 曾经 提 到 过 ， 方 法 重 载 要 求 方法 具备 不 同 的 特征 签名 ， 返 回 值 并 不 包含 在 方法 的 特征 签名 之 中 ， 所 以 返回 值 不 参与 重 载 选 择 ， 但 是 在 Class 文 件 格式 之 中 ， 只 要 描述 符 不 是 完 
全 一 致 的 两 个 方法 就 可 以 共存 。 也 就 是 说 两 个 方法 如 果 有 相同 的 名 称 和 特征 签名 ， 但 返回 值 不 同 ， 那 它们 也 是 可 以 合法 地 共存 于 一 个 Class 文 件 中 的 。 







































































由 于 Java 泛 型 的 引入 ， 各 种 场景 (虚拟 机 和 解析、 反射 等 ) 下 的 方法 调用 都 可 能 对 原 有 的 基础 产生 影响 和 新 的 需求 ， 如 在 泛 型 类 中 如 何 获取 传 入 的 参数 化 类 型 等 。 所 以 JCP 组 织 对 虚拟 机 规范 做 出 了 相应 
的 修改 ， 引 入 了 诸如 Signature 和 LocalVariableTypeTable 等 新 的 属性 用 于 解决 伴随 泛 型 而 来 的 参数 类 型 的 识别 问题 ，Signature 是 其 中 最 重要 的 一 项 属性 ， 它 的 作用 就 是 存储 一 个 方法 在 字 节 码 层 面 的 特征 


签名 B， 这 个 属性 中 保存 的 参数 类 型 并 不 是 原生 类 型 ， 而 是 包括 了 参数 化 类 型 的 信息 。 修 改 后 的 虚拟 机 规范 内 要 求 所 有 能 识别 49.0 以 上 版 本 的 Class 文 件 的 虚拟 机 都 要 能 正确 地 识别 Signature 参 数 。 





































































































从 上 面 的 例子 可 以 看 到 擦 除法 对 实际 编码 带 来 的 影响 ， 由 于 List<String> 和 List<Integer> 擦 除 后 是 同一 个 类 型 ， 我 们 只 能 添加 两 个 并 不 需要 实际 使 用 到 的 返回 值 才能 完成 重 载 ， 这 是 一 种 毫 无 优雅 和 美 
感 可 言 的 解决 方案 。 同 时 ， 从 Signature 属 性 的 出 现 我 们 还 可 以 得 出 结论 ， 擦 除法 所 谓 的 擦 除 ， 仅 仅 是 对 方法 的 Code 属 性 中 的 字 节 码 进 行 擦 除 ， 实 际 上 元 数据 中 还 是 保留 了 泛 型 信息 ， 这 也 是 我 们 能 通过 反 
射手 段 取 得 参数 化 类 型 的 根本 依据 。 






































10.3.2 ”自动 装 箱 、 拆 箱 与 遍历 循环 











就 纯 技术 的 角度 而 论 ， 自 动 装 箱 、 自 动 拆 箱 与 遍历 循环 (Foreach 循 环 ) 这 些 语法 糖 ， 无 论 是 实现 上 还 是 思想 上 都 不 能 和 上 一 节 介绍 的 泛 型 相 比 ， 两 者 的 难度 和 深度 都 有 很 大 的 差距 。 专 门 拿 出 一 节 来 
讲解 它们 只 有 一 个 理由 : 毫 无 疑问 ， 它 们 是 Java 语 言 里 面 被 使 用 得 最 多 的 语法 糖 。 我 们 通过 下 面 的 代码 清单 10-6 和 代码 清单 10-7 中 所 示 的 代码 来 看 看 这 些 语法 糖 在 编译 后 会 发 生 什 么 样 的 变化 。 



























































代码 清单 10-6 ”自动 装 箱 、 拆 箱 与 遍历 循环 


public static void main (String[] args) { 
List<Integer> list = Arrays.asList (1, 2, 3, 4); 
// 如 果 在 JDK 1.7 中 ,还 有 另外 一 颗 语 法 糖 @， 
// 能 让 上 面 这 句 代码 进一步 简写 成 List<Integer> list = [1, 2, 3, 4]; 
int sum = 0; 
for (int i : list) { 
sum += i; 
} 


System.out .println (sum); 


注 : 在 本 章 完稿 之 后 ， 此 语法 糖 随 着 Project Coin 一 起 被 划分 到 JDK 1.8 中 了 ， 在 JDK 1.7 里 不 会 包括 。 





代码 清单 10-7 “自动 装 箱 、 拆 箱 与 遍历 循环 编译 之 后 





public static void main (String[] args) { 
List list = Arrays.asList( new Integer[] { 
Integer.valueOof (1)， 
Integer.valueOf (2), 
Integer.valueOf (3) ， 


Integer.valueOf (4) 
int sum = 07 
for (Iterator localIterator = list.iterator(); localIterator.hasNext ()7 ) { 
int i = ((Integer)1localIterator.next () ) .intValue () 7 
Sum += i; 


DD); 


System.out .Println (sum); 


} 














上 面 代 码 清单 10-6 中 一 共 包含 了 泛 型 、 自 动 装 箱 、 自 动 拆 箱 、 遍 历 循环 与 变 长 参数 五 种 语法 糖 ， 代 码 清单 10-7 则 展示 了 它们 在 编译 后 的 变化 。 泛 型 就 不 必 说 了 ， 
对 应 的 包装 和 还 原 方法 ， 如 本 例子 中 的 Integer.valueOf0 与 Integer.intValue0 方 法 ， 而 遍历 循环 见 
看 看 变 长 参数 ， 它 在 调用 的 时 候 变 成 了 一 个 数组 类 型 的 参数 ， 在 变 长 参数 出 现 之 前 ， 程 序 员 就 是 使 




















动 装 箱 、 拆 箱 在 编译 之 后 被 转化 成 了 
是 把 代码 还 原 成 了 迭代 器 的 实现 ， 这 也 是 为 何 遍历 循环 需要 被 遍历 的 类 实现 lterable 接 口 的 原因 。 
数组 来 完成 类 似 功 能 的 。 












































取石 冉 






































这 些 语法 糖 虽 然 看 起 来 很 简单 ， 但 也 不 见得 就 没有 任何 值得 我 们 注意 的 地 方 ， 下 面 代码 清单 10-8 演 示 了 





自动 装 箱 的 一 些 错误 





法 。 




















代码 清单 10-8 ”自动 装 箱 的 陷阱 


public static void main (String[] args) { 
Integer a= 1; 
Integer b ¥ 
Integer C 
Integer d 
Integer e 
Integer 工 = 
Long g = 3L; 
System.out .Println 
System.out .Println 
System.out .Println 
System.out .Println 
System.out .Println 
System.out .Println 











= 3; 
= 3; 
= 321; 
= 321; 


由 


一 (a+b)); 


C 
e 
& 
Gs 
了 
g.equals(a + b)); 





看 完 代码 清单 10-8， 不 妨 思考 两 个 问题 : 一 是 代码 中 的 这 六 句 打 印 语句 的 输出 是 什么 ? 二 是 这 六 句 打 印 语句 中 ， 解 除 语法 糖 后 参数 会 是 什么 样子 ? 这 两 个 问题 的 答案 很 容易 就 都 能 试验 出 来 ， 笔 者 在 此 
暂且 略 去 答案 ， 希 望 读 者 自己 上 机 实践 一 下 。 无 论 你 的 回答 是 否 正确 ， 鉴 于 包装 类 的 “==” 在 没有 遇 到 算术 运算 的 情况 下 不 会 自动 拆 箱 ， 而 且 它 们 的 equals() 方 法 不 会 处 理 数据 转型 的 关系 ， 笔 者 建议 
在 实际 编码 中 应 尽量 避免 这 样 来 使 用 自动 装 箱 与 拆 箱 。 




















运 





























10.3.3 ”条件 编译 





许多 程序 设计 语言 都 提供 了 条 件 编译 的 途径 ， 如 C、C++ 中 使 用 预 处 理 器 指示 符 (#ifdef) 来 完成 条 件 编译 。 
命令 ) ， 而 在 Java 语 言 之 中 并 没有 使 用 预 处 理 器 ， 
个 文件 之 间 能 够 互相 提供 符号 信息 ) 无 须 使 


C、C++ 的 预 处 理 器 最 初 的 任务 是 解决 编译 时 的 代码 依赖 关系 (众所周知 的 #include 预 处 理 
因为 Java 语 言 天 然 的 编译 方式 (编译 器 并 非 一 个 一 个 地 编译 Java 文 件 ， 而 是 将 所 有 的 编译 单元 的 语法 树 顶 级 节点 输入 到 待 处 理 列表 后 再 进行 编译 ， 因 此 各 
预 处 理 器 。 那 Java 语 言 是 否 有 办 法 实现 条 件 编译 呢 ? 







































































Java 语 言 当然 也 可 以 进行 条 件 编译 ， 方 法 就 是 使 用 条 件 为 常量 的 if 语 句 。 如 代码 清单 10-9 所 示 ， 此 代码 中 的 if 语 句 不 同 于 其 他 Java 代 码 ， 它 在 编译 阶段 就 会 被 “运行 ” 
插 “System.out.println("block 1"); ”一 条 语句 ， 并 不 会 包含 if 语句 及 另外 一 个 分 子 中 的 “System.out.println("block 2"); “ 


， 生 成 的 字 节 码 之 中 只 包 


代码 清单 10-9 ”Java 语 言 的 条 件 编译 


public static void main (String[] args) { 
if (true) { 
System.out .println ("block 1"); 
} else { 
System.out .println ("block 2"); 
} 
} 





此 代码 编译 后 Class 文 件 的 反 编译 结果 : 





public static void main(String[] args) { 
System.out .println ("block 1"); 
} 











k 








只 能 使 


拒绝 编译 。 

















条 件 为 常量 的 if 语 句 才 能 达到 上 述 效果 ， 如 果 使 F 














其 他 带 有 条 件 判断 能 力 的 语句 搭配 ， 则 可 能 在 控制 流 分 析 中 提示 错误 ， 被 拒绝 编译 ， 如 下 面 





的 代码 清单 10-10 所 示 的 代码 就 会 被 编译 器 





























代码 清单 10-10 不 能 使 用 其 他 条 件 语句 来 完成 条 件 编译 





ublic static void main(String[] args) { 
// 编译 器 将 会 提示 "Unreachable code” 
while (false) { 
System.out .println(""); 
} 

i 


Java 语 言 中 条 件 编译 的 实现 ， 也 是 Java 语 言 的 一 颗 语 法 糖 ， 根 据 布尔 常量 值 的 真 假 ， 编 译 器 将 会 把 分 支 中 不 成 立 的 代码 块 消除 掉 ， 这 一 工作 将 在 编译 器 解除 语法 糖 的 阶段 











(com.sun.toolsjavac.comp.Lower 类 中 ) 完成 。 由 于 这 种 条 件 编译 的 实现 方式 使 
编译 ， 而 没有 办 法 实现 根据 条 件 调整 整个 java 类 的 结构 。 











了 if 语句 ， 所 以 它 必须 遵循 最 基本 的 Java 语 法 ， 只 能 写 在 方法 体内 部 ， 因 





此 它 只 能 实现 语句 基本 块 (Block) 级 别 的 条 件 


除了 本 节 中 介绍 的 泛 型 、 自 动 装 箱 、 








自动 拆 箱 、 遍 历 循 环 、 变 长 参数 和 条 件 编译 之 外 ，Java 语 言 还 有 不 少 其 他 的 语法 糖 ， 如 内 部 类 、 枚 举 类 、 断 言语 句 、 对 枚 举 和 字符 中 








(在 JDK 1.7 中 支持 ) 的 switch 


支持 、 在 try 语 句 中 定义 和 关闭 资源 (在 JDK 1.7 中 支持 ) 等 ， 你 可 以 通过 跟踪 Javac 源 码 、 反 编译 Class 文 件 等 方式 了 解 他 们 的 本 质 实现 ， 园 





于 篇 幅 ， 笔 者 就 不 再 一 一 介绍 了 。 





1]] 原文 : http://www.anyang-window.com.cn/quotthis-is-not-a-genericquot-bruce-eckel-eyes-of-the-generic-java/ 。 

2] 测试 的 时 候 请 使 用 Sun JDK 的 Javac 编译 器 进行 编译 ， 其 他 编译 器 ， 如 Eclipse JDT 的 ECJ 编译 器 ， 仍 然 可 能 会 拒绝 编译 这 段 代码 ，ECJ 编译 时 会 提示 “Method method(List<Stting>) has the same 
erasuremethod(List<E>) as another method in type GenericTypes” 。 

3 引 在 《Java 虚拟 机 规范 (第 2 版 ) 》 (JDK 1.5 修改 后 的 版 本 ) 的 “§ 4.4.4 Signatures” 章 节 及 《Java 语言 规范 (第 3 版 ) 》 的 “§ 8.4.2 Method Signature” 章 节 中 分 别 定义 了 字 节 码 层 面 的 方法 特征 签名 ， 以 及 
ava 代 码 层 面 的 方法 特征 签名 ， 特 征 签名 最 重要 的 任务 就 是 作为 方法 独一无二 不 可 重复 的 ID， 在 Java 代码 中 的 方法 特征 签名 只 包括 了 方法 名 称 、 参 数 顺序 及 参数 类 型 ， 而 在 字 节 码 中 的 特征 签名 还 包括 方法 返 
回 值 及 受 查 异 常 表 ， 本 书 中 如 果 指 的 是 字 节 码 层面 的 方法 签名 ， 笔 者 会 加 入 限定 语 进行 说 明 ， 也 请 读者 根据 上 下 文 语 境 注意 区 分 。 

引 JDKE1.5 对 虚拟 机 规范 修改 : http://javasun.com/docs/books/jvms/second_edition/jvms-clarify.html。 








10.4 实战 : 插入 式 注解 处 理 器 























JDK 编 译 优化 部 分 在 本 书 中 并 没有 设置 独立 的 实战 章节 ， 因 为 我 们 











发 程序 ， 考 虑 的 主要 是 程序 会 如 何 运 行 ， 很 少 会 有 针对 程序 编译 的 需求 。 也 因为 这 个 原因 ， 在 JDK 的 编译 子 系统 里 面 ， 提 供给 





















































接 控制 的 功能 相对 较 少 ， 除 了 下 一 章 会 介绍 的 虚拟 机 JIT 编 译 的 几 个 相关 参数 以 外 ， 我 们 就 只 有 使 用 JSR-296 中 定义 的 插入 式 注解 处 理 器 APl 来 对 JDK 编 译 子 系统 的 行为 产生 一 些 影 响 。 




















但 是 笔者 并 不 认为 相对 于 前 两 部 分 介绍 的 内 存 管理 子 系统 和 字 节 码 执行 子 系统 ，JDK 的 编译 子 系统 就 不 那么 重要 了 。 一 套 编程 语言 中 编译 子 系 统 的 优 务 ， 很 大 程度 上 决定 了 程序 运行 性 能 的 好 坏 和 编码 








效率 的 高 低 ， 尤 其 在 Java 语 言 中 ， 运 行 期 即时 编译 与 虚拟 机 执行 子 系统 非常 紧密 地 互相 依赖 并 配合 运作 (下 一 章 将 主要 讲解 这 方面 的 内 容 ) 。 了 解 JDK 如 何 编译 和 优化 代码 ， 有 助 于 我 们 写 出 适合 JDK 












































的 程序 。 话 题 说 远 了 ， 下 面 再 回 到 本 章 的 实战 中 来 ， 看 看 插入 式 注解 处 理 器 API 能 为 我 们 实现 什么 功能 。 








104.1 实战 目标 





通过 阅读 Javac 编 译 器 的 源码 ， 我 们 知道 编译 器 在 把 Java 程 序 源码 编译 为 字 节 码 的 时 候 ， 会 对 Java 程 序 源码 做 各 方面 的 检查 校 验 。 这 些 校 验 主要 以 程序 “ 写 得 对 不 对 ”为 出 发 点 ， 虽 然 也 有 各 种 


WARNING 的 信息 ， 但 总 体 来 讲 还 是 较 少 去 校 验 程序 “ 写 得 好 不 好 ”。 有 鉴于 此 ， 业 界 出 现 了 许多 针对 程序 “ 写 得 好 不 好 ”的 辅助 校 验 工 








































































































一 些 是 基于 Java 的 源码 进行 校 输 ， 有 一 些 是 通过 扫描 字 节 码 来 完成 ， 在 本 节 的 实战 中 ， 我 们 将 会 使 用 注解 处 理 器 APl 来 编写 一 款 拥有 自己 编码 风格 的 校 验 工具 : NameCheckProcessor。 



































， 如 CheckStyle、FindBug、Klocwork 等 。 这 些 代码 校 验 工具 有 


当然 ， 由 于 我 们 的 实战 都 是 为 了 学 习 和 演示 技术 原理 ， 而 不 是 为 了 做 出 一 款 能 媲美 CheckStyle 等 工具 的 产品 来 ， 所 以 NameCheckProcessor 的 目标 也 仅 定 为 对 Java 程 序 命名 进行 检查 ， 根 据 《Java 语 言 
规范 (第 3 版 ) 》 中 第 6.8 节 的 要 求 ，Java 程 序 命名 应 当 符合 下 列 格式 的 书写 规范 : 


“ 类 (或 接口 ) : 符合 驼 式 命名 法 ， 首 字母 大 写 。 


“方法: 符合 驼 式 命名 法 ， 首 字母 小 写 。 


“ 类 或 实例 变量 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 








“ 常量 : 要 求全 部 由 大 写字 母 或 下 划 线 构成 ， 并 且 第 一 个 字符 不 能 是 下 划 线 。 








上 文 提 到 的 驼 式 命名 法 (Camel Case Names) ， 正 如 它 的 名 称 所 表示 的 那样 ， 是 指 混合 使 用 大 小 写字 母 来 分 割 构成 变量 或 函数 的 名 字 ， 犹 如 驼峰 一 般 ， 这 是 当前 Java 语 言 中 主流 的 命名 规范 ， 我 们 的 
实战 目标 就 是 为 Javac 编 译 器 添加 一 个 额外 的 功能 ， 在 编译 程序 时 检查 程序 名 是 否 符合 上 述 对 类 (或 接口 ) 、 方 法 、 字 段 的 命名 要 求 [1]。 


10.4.2 ”代码 实现 





























第 二 个 参数 “roundEnv” 中 访问 到 当前 这 个 Round 中 的 语法 树 节点 ， 每 个 语法 树 节点 在 这 里 表示 为 一 个 Element。 在 JDK 1.6 新 增 的 javax.lang.model 包 中 定义 了 16 类 Element， 包 括 了 Java 代 码 中 最 常 
的 元 素 , 如 : “ 包 (PACKAGE) 、 枚 举 (ENUM) 、 类 (CLASS) 、 注 解 (ANNOTATION TYPE) 、 接 


本 地 变量 (LOCAL VARIABLE) 、 异 常 (EXCEPTION_PARAMETER) 、 




















要 通过 注解 处 理 API 实 现 一 个 编译 器 插件 ， 首 先 需要 了 解 这 组 API 的 一 些 基 本 知识 。 我 们 实现 注解 处 理 器 的 代码 需要 继承 抽象 类 javax.annotation.processing.AbstractProcessor， 这 个 抽象 类 中 只 有 一 


个 必须 覆盖 的 abstract 方 法 : “process0”， 它 是 Javac 编 译 器 在 执行 注解 处 理 器 代码 时 要 调用 的 过 程 ， 我 们 可 以 从 这 个 方法 的 第 一 个 参数 “annotations” 中 获取 到 此 注解 处 理 器 所 要 处 理 的 注解 集合 


， 从 











方法 (METHOD) 、 构 造 函 数 (CONSTRUCTOR) 、 静 态 语句 块 (STATIC_INIT， 即 staticf 块 ) 、 实 例 语句 块 

















口 (INTERFACE) 、 枚 举 值 (ENUM_CONSTANT) 、 字 段 (FIELD) 、 参 数 (PARAMETER) 、 


(INSTANCE_INIT， 即 人 } 块 ) 、 参 数 化 类 型 (TYPE_PARAMETER， 即 泛 型 尖 括 号 内 的 类 型 ) 和 未 定义 的 其 他 语法 树 节点 (OTHER) ”。 除 了 process() 方 法 的 传 入 参数 之 外 ， 还 有 一 个 很 常用 的 实例 变 
量 “processingEnv”， 它 是 AbstractProcessor 中 的 一 个 protected 变 量 ， 在 注解 处 理 器 初始 化 的 时 候 (init() 方 法 执行 的 时 候 ) 创建 ， 继 承 了 AbstractProcessor 的 注解 处 理 器 代码 可 以 直接 访问 到 它 。 
表 了 注解 处 理 器 框架 提供 的 一 个 上 下 文 环境 ， 要 创建 新 的 代码 、 向 编译 器 输出 信息 、 获 取 其 他 工具 类 等 都 需要 用 到 这 个 实例 变量 。 






























































注解 处 理 器 除了 process() 方 法 及 其 参数 之 外 ， 还 有 两 个 可 以 配合 使 


的 Annotations: @SupportedAnnotationTypes 和 @SupportedSourceVersion， 前 者 代表 了 这 个 注解 处 理 器 对 哪些 注解 感 




















趣 ， 可 以 使 用 星 号 “*” 作 为 通配符 代表 对 所 有 的 注解 都 感 兴趣 ， 后 者 指出 这 个 注解 处 理 器 可 以 处 理 哪 些 版 本 的 Java 代 码 。 

















它 代 


Av 
A 


每 一 个 注解 处 理 器 在 运行 的 时 候 都 是 单 例 的 ， 如 果 不 需 要 改变 或 生成 语法 树 的 内 容 ，process() 方 法 就 可 以 返回 一 个 值 为 false 的 布尔 值 ， 通 知 编译 器 这 个 Round 中 的 代码 未 发 生变 化 ， 无 须 构造 新 的 














JavaCompiler 实 例 ， 在 这 次 实战 的 注解 处 理 器 中 只 对 程序 命名 进行 检查 ， 不 需要 改变 语法 树 的 内 容 ， 因 此 process() 方 法 的 返回 值 都 是 false。 关 于 注解 处 理 器 的 AP1， 笔 者 就 简单 介绍 这 些 ， 对 这 个 领域 有 兴 
趣 的 读者 可 以 阅读 相关 的 帮助 文档 。 我 们 来 看 看 注解 处 理 器 NameCheckProcessor 的 具体 代码 ， 如 代码 清单 10-11 所 示 。 





代码 清单 10-11 注解 处 理 器 NameCheckProcessor 


// 可 以 用 "*" 表 示 支 持 所 有 的 Annotations 

@SupportedAnnotationTypes ("*") 

// 只 支持 JDK 1.6 的 Java 代 码 

@SupportedSourceVersion (SourceVersion.RELEASE 6) 

public class NameCheckProcessor extends AbstractProcessor { 
private NameChecker nameChecker; 


/** 
人 查 插件 


QOverride 

public void init (ProcessingEnvironment processingEnv) { 
super.init (processingEnv); 
nameChecker = new NameChecker (processingEnv); 

} 


大 大 


yi 语法 树 的 各 个 节点 进行 进行 名 称 检查 


QOverride 





























public boolean process (Set<? extends TypeElement> annotations, 


RoundPnvironment roundEnv) { 
if (!roundEnv.processingOver()) { 


for (Element element : roundEnv.getRootElements()) 


nameChecker .checkNames (element); 
} 


return false; 


从 上 面 的 代码 可 以 看 到 NameCheckProcessor 能 处 理 基 于 JDK 1.6 的 源码 ， 它 不 限于 特定 的 注解 ， 对 任何 代码 都 “ 感 兴趣 ”， 而 在 process() 方 法 中 是 把 当前 Round 中 的 每 一 个 RootElement 传 递 到 一 个 
名 为 NameChecker 的 检查 器 中 执行 名 称 检查 逻辑 ，NameChecker 的 代码 如 代码 清单 10-12 所 示 。 





代码 清单 10-12 命名 检查 器 NameChecker 


/** 

* 程序 名 称 规范 的 编译 器 插件 ，<br> 

* 如 果 程 序 命名 不 合 规范 ， 将 会 输出 一 个 编译 器 的 WARNING 信 息 
A 


public class NameChecker { 
private final Messager messager; 
NameCheckScanner nameCheckScanner = new NameCheckScanner () 7 
NameChecker (ProcessingEnvironment processsingEnv) { 
this.messager = processsingEnv.getMessager (); 











} 

/x 

* 对 Java 程 序 命名 进行 检查 ， 根 据 《Java 语 言 规范 (第 3 版 》6.8 节 的 要 求 ，Java 程 序 命名 应 当 符合 下 列 格式 : 
要 -Do 

* <1i> 类 或 接口 :符合 驼 式 命名 法 ， 首 字母 大 写 。 
* <1i> 方 法 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 

* <1i> 字 段 : 

i 

* <1i> 类 、 实 例 变量 : 符合 驼 式 命名 法 ， 首 字母 小 
* <1i> 常 量 : 多 部 大 写 。 

* </ul> 

* </ul> 

Sy 


public void checkNames (Element element) { 
nameCheckScanner .scan (element); 
i 
* 名 称 检查 器 实现 类 ， 继 承 了 JDK 1.6 中 新 提供 的 ElementScanner6<br> 
* 将 会 以 Visitor 模 式 访问 抽象 语法 树 中 的 元 素 
人 


private class NameCheckScanner extends ElementScanner6<Void, Void> { 
大 


光 De 于 检查 Java 类 


QOverrigde 
public Void visitType (TypeElement e, Void p) { 
scan(le.getTypeParameters(), p); 


checkCamelCase (e, true); 
super.visitType (e, p); 
return null; 


} 
人 
* 检查 方法 命名 是 否 合法 


a 

QOverride 

public Void visitExecutable (ExecutableElement e, Void p) { 
if (e.getKind() == METHOD) { 


Name name = e.getSimpleName () 7 

if (name.contentEquals (e.getEnclosingElement () .getSimpleName ())) 
messager .printMessage (WARNING, 机 "m+ name + "不 应 
当 与 类 名 重复 ， 避 人 免 与 构造 函数 产生 混淆 "，e) 


checkCamelCase (le, false); 








} 
super.visitExecutable (e, p); 
return null; 
} 
EE 
* 检查 变量 命名 是 否 合法 
六 
/ 
QOverride 
Ee Void visitVariable (VariableElement e, Void p 
// 如 果 这 个 Variable 是 枚 举 或 常量 ， 则 按 大 写 命名 检查 ， 轩 则 按照 陀 式 命名 法 规则 术 查 
if (e.getKind() == ENUM CONSTANT || e.getConstantValue() != null || 
heuristicallyConstant(e)) 
checkAllCaps (e); 
else 
checkCamelCase (e, false); 
return null; 


J 
* 判断 一 个 变量 是 否 是 常量 
才思 
private boolean heuristicallyConstant (VariableElement e) { 
if (e.getEnclosingElement () .getKind() == INTERFACE) 
return true; 
else if (e.getKind() == FIELD && e.getModifiers () .containsAll (EnumSet .of (PUBLIC， STATIC, FINAL))) 
return true; 
else { 


return false; 
} 
} 


大 大 


过 ih 如 果 不 符合 ， 则 输出 警告 信息 


i void checkCamelCase (Element e, boolean initialCaps) { 
String name = e.getSimpleName () .toString (); 
boolean previousUpper = false; 
boolean conventional = true; 
int firstCodePoint = name.codePointAt (0); 
if (Character.isUpperCase (firstCodePoint)) { 
previousUpper = true; 
if (!initialCaps) { 
messager .printMessage (WARNING， "名 称 "" + name + "" 应 当 以 小 写字 
母 开头 "，e); 


return; 


} else if (Character.isLowerCase (firstCodePoint)) { 
if (initialCaps) { 
messager .printMessage (WARNING,，" 名 称 "" + name + "" 应 当 以 大 写字 
母 开头 "，e) 7 


return; 





} 
} else 
conventional = false; 
if (conventional) { 
int cp = firstCodePoint; 
for (int i = Character.charCount (cp); i < name.length(); i += 
Character.charCount (cp)) { 
cp = name.codePointAt (i); 
if (Character.isUpperCase (cp)) { 
if (previousUpper) { 
conventional = false; 
break; 
} 
previousUpper = true; 
} else 
previousUpper = false; 


} 
} 
if (!conventional) 
messager .printMessage (WARNING,， "名称 "" + name + "" 应 当 符合 驼 式 命名 法 
(Camel Case Names) ", e); 
} 


/** 
A 要 求 第 一 个 字母 必须 是 大 写 的 英文 字母 ， 其 余部 分 可 以 是 下 划 线 或 大 写字 母 





private void checkAllCaps (Element e) { 
String name = e.getSimpleName () .toString (); 
boolean conventional = true; 
int firstCodePoint = name.codePointAt (0); 
if (!Character.isUpperCase (firstCodePoint)) 
conventional = false; 
else { 
boolean previousUnderscore = false; 
int cp = firstCodePoint; 
for (int i = Character.charCount (cp); i < name.length(); i += 
Character.charCount (cp)) { 
cp = name.codePointAt (i); 
让 于 
if (previousUnderscore) { 
conventional = false; 
break; 


PreviousUnderscore = true; 
} else { 
previousUnderscore = false; 
if (!Character.isUpperCase(cp) && !Character.isDigit(cp)) { 
conventional = false; 
break; 


} 


if (!conventional) 
messager .printMessage (WARNING,， "常量 "" + name + "" 应 当 全 部 以 大 写字 母 
或 下 划 线 命名 ， 并 且 以 字母 开头 "，e) 


NameChecker 的 代码 看 起 来 有 点 长 ， 但 实际 上 注释 占 了 很 大 一 部 分 ， 而 且 即 使 算 上 注释 也 不 到 190 行 。 它 通过 一 个 继承 于 javax.lang.model.util.ElementScanner6 的 NameCheckScanner 类 ,以 
Visitor 模 式 来 完成 对 语法 树 的 遍历 ， 分 别 执行 visitType(0、visitVariable0 和 visitExecutable() 方 法 来 访问 类 、 字 段 和 方法 ， 这 3 个 visit 方 法 对 各 自 的 命名 规则 做 相应 的 检查 ，checkCamelCase() 与 
checkAllCaps0 方 法 则 用 于 实现 驼 式 命名 法 和 全 大 写 命名 规则 的 检查 。 





























整个 注解 处 理 器 只 需 NameCheckProcessor 和 NameChecker 两 个 类 就 可 以 全 部 完成 ， 为 了 验证 我 们 的 实战 成 果 ， 代 码 清单 10-13 中 提供 了 一 段 命名 规范 的 “反面 教材 ”代码 ， 其 中 的 每 一 个 类 、 方 法 
及 字段 的 命名 都 存在 问题 ， 但 是 使 用 普通 的 Javac 编 译 这 段 代 码 时 不 会 提示 任意 一 个 Warning 信 息 。 





























代码 清单 10-13 ”包含 了 多 处 不 规范 命名 的 代码 样 例 





public class BADLY NAMED CODE { 
enum colors { 
red, blue, green; 
} 
static final int FORTY TWO = 42; 
public static int NOT A CONSTANT = FORTY TWO; 
protected void BADLY NAMED ) CODE() { 
return; 


} 
public void NOTcamelCASEmethodNAME () { 
return; 


} 





10.4.3 ”运行 与 测试 











我 们 可 以 通过 Javac 命 令 的 “-processor” 参 数 来 执行 编译 时 需要 附带 的 注解 处 理 器 ， 如 果 有 多 个 注解 处 理 器 的 话 ， 用 喜 号 分 隔 。 还 可 以 使 用 -XprintRounds 和 -XprintProcessorlnfo 参 数 来 查看 注解 处 
理 器 运作 的 详细 信息 ， 本 次 实战 中 的 NameCheckProcessor 的 编译 及 执行 过 程 如 代码 清单 10-14 所 示 。 























代码 清单 10-14 注解 处 理 器 的 运行 过 程 





D:\src>javac org/fenixsoft/compile/NameChecker .java 

D:\src>javac org/fenixsoft/compile/NameCheckProcessor.java 

D:\src>javac -processor org.fenixsoft.compile.NameCheckProcessor org/fenixsoft/compile/BADLY 1 NAMED CODE .java 
org\fenixsoft\compile\BADLY NAMED CODE .java:3: 警告 名 称 "BADLY_NAMED _CODE" 应 当 符合 驼 式 命名 法 (Camel Case Names) 
public class BADLY NAMED CODE { 


加 
工 
琉 


org\fenixsoft\compile\BADLY NAMED CODE.java:5: : 名 称 "colors" 应 当 以 大 写字 母 开 头 


enum Colors { 





n 
蒋 


org\fenixsoft\compile\BADLY NAMED CODE.java:6: 
red, blue, green; 


告 : 常量 "reqd" 应 当 全 部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 





n 
蒋 


org\fenixsoft\compile\BADLY NAMED CODE.java:6: 
red, blue, green; 


告 : 常量 "blue" 应 当 全 部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 








n 
蒋 
下 


org\fenixsoft\compile\BADLY NAMED CODE.java:6: 
red, blue, green; 


i: 常量 "green" 应 当 全 部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 


© 
工 
琉 


org\fenixsoft\compile\BADLY NAMED CODE.java:9: 
static final int FORTY TWO = 42; 


: 常量 "FORTY_TWO" 应 当 全 部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 





oN er oortN odie NAMED CODE .java:11: 警告 名称 "NOT_A_CONSTANT" 应 当 以 小 写字 母 开头 
public static int NOT A CONSTANT = _FORTY TO; 

org\fenixsoft\compile\BADLY NAMED CODE.java:13: 警告 : 名 称 "Test" 应 当 以 小 写字 母 开头 
protected void Test () { 


org\fenixsoft\compile\BADLY NAMED CODE .java:17: 和 警告: 名 称 "NOTcamelCASEmethodNAME" 应 当 以 小 写字 母 开 头 
public void NOTcamelCASEmethodNAME () { 





10.4.4 ”其 他 应 用 案例 

















NameCheckProcessor 的 实战 例子 只 演示 了 JSR-269 嵌 入 式 注解 处 理 API 其 中 的 一 部 分 功能 ， 基 于 这 组 APl 支 持 的 项 目 还 有 用 于 校 验 Hibernate 标 签 使 用 正确 性 的 Hibernate Validator Annotation 


Processor2] (本 质 上 与 NameCheckProcessor 所 做 的 事情 差不多 ) 、 自 动 为 字段 生成 getter 和 setter 方 法 的 Project LombokB] (根据 已 有 元 素 生成 新 的 语法 树 元 素 ) 等 ， 读 者 有 兴趣 的 话 可 以 参考 它们 官 
方 站 点 的 相关 内 容 。 














nl 

















[由 在 JDK 的 sample/javac/processing 目录 中 有 这 次 实战 的 源码 (稍微 复杂 一 些 , 但 大 体 上 差距 不 大 ) ， 读 者 可 以 阅读 参考 。 
轨 官方 站 点 : http://www.hibernate.org/subprojects/validator.html。 


[3] 官方 站 点 : http://projectlombok.org/。 


10.5 本章 小 结 

















在 本 章 中 ， 我 们 从 编译 器 源码 实现 的 层次 上 了 解 了 Java 源 代码 编译 为 字 节 码 的 过 程 ， 分 析 了 Java 语 言 中 泛 型 、 主 动 装 箱 拆 箱 、 条 件 编译 等 多 种 语法 糖 的 前 因 后 果 ， 并 实战 练习 了 如 何 使 用 插入 式 注解 处 
理 器 来 完成 一 个 检查 程序 命名 规范 的 编译 器 插件 。 如 本 章 概述 中 所 说 的 ， 在 前 端 编译 器 中 ，“ 优 化 ”手段 主要 用 于 提升 程序 的 编码 效率 ， 之 所 以 把 Javac 这 类 将 Java 代 码 转变 为 字 节 码 的 编译 器 称 做 “前 端 编 
译 器 ”， 是 因为 它 只 完成 了 从 程序 到 抽象 语法 树 或 中 间 字 节 码 的 生成 ， 而 在 此 之 后 ， 还 有 一 组 内 置 于 虚拟 机 内 部 的 “后 端 编译 器 ”完成 了 从 字 节 码 生 成 本 地 机 器 码 的 过 程 ， 即 前 面 多 次 提 到 的 即时 编译 器 或 
必 编 译 器 ， 这 个 编译 器 的 编译 速度 及 编译 结果 的 优 劣 ， 是 衡量 虚拟 机 性 能 很 重要 的 一 个 指标 。 下 一 章 将 会 讲解 即时 编译 器 的 运作 和 优化 过 程 。 



































第 11 章 晚期 (运行 期 ) 优化 


本 章 主要 内 容 





“概述 


“HotSpot 虚拟 机 内 的 即时 编译 器 








“ 编译 优化 技术 

"Java 与 C/C++ 的 编译 器 对 比 

从 计算 机 程序 出 现 的 第 一 天 起 ， 对 效率 的 追逐 就 是 程序 天 生 的 坚定 信仰 ， 这 个 过 程 犹如 一 场 没有 终点 、 永 不 停歇 的 F1 方 程式 竞赛 ， 程 序 员 是 车 手 ， 技 术 平台 则 是 在 赛 道上 飞驰 的 赛车 。 
11.1 概述 








在 部 分 的 商用 虚拟 机 (Sun HotSpot、IBM J9) 中 ，Java 程 序 最 初 是 通过 解释 器 (Interpreter) 进行 解释 执行 的 ， 当 虚拟 机 发 现 某 个 方法 或 代码 块 的 运行 特别 频繁 ， 就 会 把 这 些 代码 认定 为 “热点 代 
码 ” (Hot Spot Code) ， 为 了 提高 热点 代码 的 执行 效率 ， 在 运行 时 ， 虚 拟 机 将 会 把 这 些 代码 编译 成 与 本 地 平台 相关 的 机 器 码 ， 并 进行 各 种 层次 的 优化 ， 完 成 这 个 任务 的 编译 器 称 为 即时 编译 器 (Just In 
Time Compiler， 下 文中 简称 JIT 编 译 器 ) 。 








即时 编译 器 并 不 是 虚拟 机 必需 的 部 分 ，Java 虚 拟 机 规范 并 没有 规定 Java 虚 拟 机 内 必须 要 有 即时 编译 器 ， 更 没有 限定 或 指导 即时 编译 器 应 该 如 何 去 实 现 。 但 是 ， 即 时 编译 器 编译 性 能 的 好 坏 、 代 码 优化 程 
度 的 高 低 却 是 衡量 一 款 商用 虚拟 机 优秀 与 否 的 最 关键 的 指标 之 一 ， 它 也 是 虚拟 机 中 最 核心 最 能 体现 技术 水 平 的 部 分 。 在 本 章 中 ， 我 们 将 走 进 虚 拟 机 的 内 部 ， 探 索 即 时 编译 器 的 运作 过 程 。 





























由 于 Java 虚 拟 机 规范 没有 具体 的 约束 规则 去 限制 即时 编译 器 应 该 如 何 实现 ， 所 以 这 部 分 功能 完全 是 与 虚拟 机 具体 实现 (Implementation Specific) 相关 的 内 容 ， 如 无 特殊 说 明 ， 本 章 中 所 提 及 的 编译 
器 、 即 时 编译 器 都 是 指 HotSpot 虚 拟 机 内 的 即时 编译 器 ， 虚 拟 机 也 是 特 指 HotSpot 虚 拟 机 。 不 过 ， 本 章 中 的 大 部 分 内 容 是 描述 即时 编译 器 的 行为 ， 涉 及 编译 器 实现 层面 的 内 容 较 少 ， 而 主流 虚拟 机 中 即时 编 
译 器 的 行为 又 有 很 多 相似 相通 之 处 ， 因 此 对 其 他 虚拟 机 来 说 也 具备 较 大 的 参考 意义 。 

















11.2 ” HotSpot 虚拟 机 内 的 即时 编译 器 


本 节 中 ， 我 们 将 要 了 解 HotSpot 虚 拟 机 内 的 即时 编译 器 的 运作 过 程 ， 同 时 ， 我 们 要 解决 以 下 几 个 问题 : 
“为何 HotSpot 虚 拟 机 要 使 用 解释 器 与 编译 器 并 存 的 架构 ? 
“为何 HotSpot 虚 拟 机 要 实现 两 个 不 同 的 即时 编译 器 ? 
“ 程序 何 时 使 用 解释 器 执行 ? 何 时 使 用 编译 器 执行 ? 
“ 哪些 程序 代码 会 被 编译 为 本 地 代码 ? 如 何 编 译本 地 代码 ? 


“如何 从 外 部 观察 即时 编译 器 的 编译 过 程 和 编译 结果 ? 


11.2.1 解释 器 与 编译 器 

















尽管 并 不 是 所 有 的 Java 虚 拟 机 都 采用 解释 器 与 编译 器 并 存 的 架构 ， 但 许多 主流 的 商用 虚拟 机 ， 如 HotSpot、J9 等 ， 都 同时 包含 解释 器 与 编译 器 [1]， 解 释 器 与 编译 器 两 者 各 有 优势 : 当 程序 需要 迅速 启动 
和 执行 的 时 候 ， 解 释 器 可 以 首先 发 挥 作用 ， 省 去 编译 的 时 间 ， 立 即 执行 。 当 程序 运行 后 ， 随 着 时 间 的 推移 ， 编 译 器 逐渐 发 挥 作用 ， 把 越 来 越 多 的 代码 编译 成 本 地 代码 之 后 ， 可 以 获取 更 高 的 执行 效率 。 当 程 
序 运 行 环境 中 内 存 资源 限制 较 大 (如 部 分 嵌入 式 系统 中 ) ， 可 以 使 用 解释 执行 节约 内 存 ， 反 之 可 以 使 用 编译 执行 来 提升 效率 。 同 时 ， 解 释 器 还 可 以 作为 编译 器 激进 优化 时 的 一 个 “逃生 门 ”， 让 编译 器 根据 
概率 选择 一 些 大 多 数 时 候 都 能 提升 运行 速度 的 优化 手段 ， 当 激进 优化 的 假设 不 成 立 ， 如 加 载 了 新 类 后 类 型 继承 结构 出 现 变化 、 出 现 “ 罕 见 陷阱 ” (Uncommon Trap) 时 可 以 通过 逆 优 化 
(Deoptimization) 退回 到 解释 状态 继续 执行 (部 分 没有 解释 器 的 虚拟 机 中 也 会 采用 不 进行 激进 优化 的 C1 编 译 器 担任 “逃生 门 ” 的 角色 ) ， 因 此 在 整个 虚拟 机 执行 架构 中 ， 解 释 器 与 编译 器 经 常 是 相辅相成 
地 配合 工作 的 ， 如 图 11-1 所 示 。 











































































































即时 编译 
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逆 优 化 


图 11-1 解释 器 与 编译 器 的 交互 




















HotSpot 虚 拟 机 中 内 置 了 两 个 即时 编译 器 ， 称 为 Client Compiler 和 Server Compiler, 或 者 简称 为 C1 编译 器 和 C2 编译 器 (也 叫 Opto 编 译 器 ) 。 目 前 主流 的 HotSpot 虚 拟 机 中 (Sun 系列 JDK 1.6 及 之 前 
版 本 的 虚拟 机 ) ， 默 认 是 采用 解释 器 与 其 中 一 个 编译 器 直接 配合 的 方式 工作 ， 程 序 使 用 哪个 编译 器 ， 取 决 于 虚拟 机 运行 的 模式 ，HotSpot 虚 拟 机 会 根据 自身 版 本 与 宿主 机 器 的 硬件 性 能 自动 选择 运行 模式 ， 
户 也 可 以 使 用 -client 或 -server 参 数 去 强制 指定 虚拟 机 运行 在 Client 模 式 还 是 Server 模 式 。 


























































































































无 论 采用 的 编译 器 是 Client Compiler 还 是 Server Compiler， 解 释 器 与 编译 器 搭配 使 用 的 方式 在 虚拟 机 中 被 称 为 “混合 模式 ” (Mixed Mode) ， 用 户 可 以 使 用 参数 -Xint 强 制 虚拟 机 运行 于 “解释 模 
式 ” (Interpreted Mode) ， 这 时 候 编译 器 完全 不 介入 工作 ， 全 部 代码 都 使 用 解释 方式 执行 。 另 外 ， 也 可 以 使 用 参数 -Xcomp 强 制 虚拟 机 运行 于 “编译 模式 ” (Compiled Mode) ， 这 时 候 将 优先 采用 编 
译 方式 执行 程序 ， 但 是 解释 器 仍然 要 在 编译 无 法 进行 的 情况 下 介入 执行 过 程 ， 可 以 通过 虚拟 机 的 -version 命 令 的 输出 结果 显示 出 这 三 种 模式 ， 如 代码 清单 11-1 所 示 ， 请 读者 注意 黑体 字 部 分 。 










































































代码 清单 11-1 ”虚拟 机 执行 模式 





C:\>java -version 

java version "1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server VM (build 0.2-b02-internal, 19.0-b04-internal, mixed mode) 
C:\>java -Xint -Version 

java version "1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server WM (build 0.2-b02-internal, 19.0-b04-internal, interpreted mode) 
C:\>java -Xcomp -version 

java version "1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server WM (build 0.2-b02-internal, 19.0-b04-internal, compiled mode) 


























由 于 即时 编译 器 编译 本 地 代码 需要 占用 程序 运行 时 间 ， 要 编译 出 优化 程度 更 高 的 代码 ， 所 花费 的 时 间 可 能 越 长 ， 而 且 想 要 编译 出 优化 程度 更 高 的 代码 ， 解 释 器 可 能 还 要 蔡 编 译 器 收集 性 能 监控 信息 ， 这 
对 解释 执行 的 速度 也 有 所 影响 。 为 了 在 程序 启动 响应 速度 与 运行 效率 之 间 达 到 最 佳 平衡 ，HotSpot 虚 拟 机 将 会 逐渐 启用 分 层 编译 (Tiered Compilation) 的 策略 向 ， 分 层 编译 的 概念 在 JDK 1.6 时 期 出 现 ， 后 
来 一 直 处 于 改进 阶段 ， 最 终 在 JDK 1.7 的 Server 模 式 虚 拟 机 中 作为 默认 编译 策略 被 开启 。 分 层 编译 根据 编译 器 编译 、 优 化 的 规模 与 耗 时 ， 划 分 出 不 同 的 编译 层次 ， 其 中 包括 : 









































“ 第 0 层 : 程序 解释 执行 ， 解 释 器 不 开启 性 能 监控 功能 (Profiling) ， 可 触发 第 1 层 编译 。 
“ 第 1 层 : 也 称 为 C1 编译 ， 将 字 节 码 编译 为 本 地 代码 ， 进 行 简单 可 靠 的 优化 ， 如 有 必要 将 加 入 性 能 监控 的 逻辑 。 


“ 第 2 层 (或 2 层 以 上 ) : 也 称 为 C2 编 译 ， 也 是 将 字 节 码 编译 为 本 地 代码 ， 但 是 会 启用 一 些 编译 耗 时 较 长 的 优化 ， 甚 至 会 根据 性 能 监控 信息 进行 一 些 不 可 靠 的 激进 优化 。 



































实施 分 层 编译 后 ，Client Compiler 和 Server Compiler 将 会 同时 工作 ， 许 多 代码 都 可 能 会 被 多 次 编译 ， 用 Client Compiler 获 取 更 高 的 编译 速度 ， 用 Server Compiler 来 获取 更 好 的 编译 质量 ， 在 解释 执 
行 的 时 候 也 无 须 再 承担 收集 性 能 监控 信息 的 任务 。 


11.2.2 ”编译 对 象 与 触发 条 件 


在 概述 中 提 到 过 在 运行 过 程 中 会 被 即时 编译 器 编译 的 “热点 代码 ”有 两 类 ， 即 

















: 被 多 次 调用 的 方法 。 
“ 被 多 次 执行 的 循环 体 。 
前 者 很 好 理解 ， 一 个 方法 被 调用 得 多 了 ， 方 法 体内 代码 执行 的 次 数 自然 就 多 ， 它 成 为 “热点 代码 ”是 理所当然 的 。 而 后 者 则 是 为 了 解决 当 一 个 方法 只 被 调用 过 一 次 或 几 次 ， 但 是 方法 体内 部 存在 循环 次 

















数 较 多 的 循环 体 ， 这 样 循 环 体 的 代码 也 被 重复 执行 多 次 ， 因 此 这 些 代 码 也 应 该 成 为 “热点 代码 ”。 




















对 于 第 一 种 情况 ， 由 于 是 由 方法 调用 触发 的 编译 ， 那 编译 器 理所当然 地 会 以 整个 方法 作为 编译 对 象 ， 这 种 编译 也 是 虚拟 机 中 标准 的 编译 方式 。 而 对 于 后 一 种 情况 ， 尽 管 编译 动作 是 由 循环 体 所 触发 的 ， 
但 编译 器 依然 会 以 整个 方法 (而 不 是 单独 的 循环 体 ) 作为 编译 对 象 。 这 种 编译 方式 因为 编译 发 生 在 方法 执行 过 程 之 中 ， 因 此 被 很 形象 地 称 为 栈 上 蔡 换 (On Stack Replacement，OSR) 。 























读者 可 能 还 会 有 疑问 ， 在 上 面 的 文字 描述 里 ， 无 论 是 “多 次 执行 的 方法 ”， 还 是 “多 次 执行 的 代码 块 ”， 所 谓 “ 多 次 ”都 不 是 一 个 具体 、 严 谨 的 用 语 ， 那 到 底 多 少 次 才 算 “ 多 次 ” 呢 ? 还 有 一 个 问题 ， 
就 是 虚拟 机 如 何 统计 一 个 方法 或 一 段 代码 被 执行 过 多 少 次 呢 ? 解决 了 这 两 个 问题 ， 也 就 回答 了 即时 编译 被 触发 的 条 件 。 


























要 知道 一 段 代码 是 不 是 热点 代码 ， 是 不 是 需要 触发 即时 编译 ， 这 个 行为 称 为 热点 探测 (Hot Spot Detection) ， 其 实 进行 热点 探测 并 不 一 定 要 知道 方法 具体 被 调用 了 多 少 次 ， 目 前 主要 的 热点 探测 判定 
方式 有 两 种 B]， 分 别 是 : 














“ 基于 采样 的 热点 探测 (Sample Based Hot Spot Detection) : 采用 这 种 方法 的 虚拟 机 会 周期 性 地 检查 各 个 线程 的 栈 顶 ， 如 果 发 现 菜 个 (或 菜 些 ) 方法 经 常 出 现在 栈 顶 ， 那 这 个 方法 就 是 “热点 方法 ”。 基 


于 采样 的 热点 探测 的 好 处 是 实现 简单 高 效 ， 还 可 以 很 容易 地 获取 方法 调用 关系 将 调用 堆栈 展开 即 可 ) ， 缺 点 是 很 难 精确 地 确认 一 个 方法 的 热度 ， 容 易 因 为 受到 线程 阻塞 或 别 的 外 界 因素 的 影响 而 扰乱 热点 


探测 。 


“ 基于 计数 器 的 热点 探测 


“热点 方法 ”。 


时 


下 


(Counter Based Hot Spot Detection) : 


这 种 统计 方法 实现 起 来 麻烦 一 些 ， 需 要 为 每 个 方法 建立 并 





革 














在 HotSpot 虚 拟 机 中 使 


的 是 第 二 种 


于 计数 器 的 热 





EE 


中 方法 的 虚拟 机 会 为 每 个 方法 (甚至 是 代码 块 ) 建立 计数 器 ， 统 计 方法 的 执行 次 数 ， 如 果 执 行 次 数 超过 一 定 的 冰 值 就 认为 它 
维护 计数 器 ， 而 且 不 能 直接 获取 到 方法 的 调用 关系 。 但 是 它 的 统计 结果 相对 来 说 更 加 精确 严谨 。 


采用 这 























因此 它 为 每 个 方法 准备 了 两 个 计数 器 : 方法 调用 计数 器 (Invocation Counter) 和 回 边 计数 器 (Back Edge Counter) 。 








点 探测 方法 ， 














在 确定 虚拟 机 运行 参数 的 前 提 下 ， 这 两 个 计数 器 都 有 一 个 确定 的 阔 值 ， 当 计数 器 超过 阔 值 溢出 了 ， 就 会 触发 川 编译 。 

















我 们 首先 来 看 看 方法 调 





CompileThreshold 来 人 工 设 定 。 当 一 个 方法 被 调 有 
计数 器 值 加 1， 然 后 判断 方法 调 








计数 器 。 顾 名 思 义 ， 这 个 计数 器 














的 次 数 ， 它 的 默认 阔 值 在 Client 模 式 下 是 1500 次 ， 在 Server 模 式 下 是 10000 次 ， 这 个 阔 值 可 以 通过 虚拟 机 参数 -XX: 








于 统计 方法 被 调 














时 ， 会 先 检查 该 方法 是 否 存在 被 川 编译 过 的 版 本 ， 如 果 存在 ， 则 优先 使 用 编译 后 的 本 地 代码 来 执行 。 如 果 不 存 在 已 被 编译 过 的 版 本 ， 则 将 此 方法 的 调用 
































































































































计数 器 与 回 边 计数 器 值 之 和 是 否 超过 方法 调 





计数 器 的 阔 值 。 如 果 已 超过 阔 值 的 话 ， 将 会 向 即时 编译 器 提交 一 个 该 方法 的 代码 编译 请 求 。 




















































































































在 默认 设置 下 ， 执 行 引擎 并 不 会 同步 等 待 编译 请 求 完成 ， 而 是 继续 进入 解释 器 按照 解释 方式 执行 字 节 码 ， 直 到 提交 的 请 求 被 编译 器 编译 完成 。 当 编译 工作 完成 之 后 ， 这 个 方法 的 调用 入 口 地 址 就 会 被 系 
统 自动 改写 成 新 的 地 址 ， 下 一 次 调用 该 方法 时 就 会 使 用 已 编译 的 版 本 ， 整 个 JI 编译 的 交互 过 程 如 图 11-2 所 示 。 

在 默认 设置 下 ， 方 法 调用 计数 器 统计 的 并 不 是 方法 被 调用 的 绝对 次 数 ， 而 是 一 个 相对 的 执行 频率 ， 即 一 段 时 间 之 内 方法 被 调用 的 次 数 。 当 超过 一 定 的 时 间 限 度 ， 如 果 方 法 的 调用 次 数 仍然 不 足以 让 它 提 
交 给 即时 编译 器 编译 ， 那 这 个 方法 的 调用 计数 器 就 会 被 减少 一 半 ， 这 个 过 程 称 为 方法 调用 计数 器 的 热度 衰减 (Counter Decay) ， 而 这 段 时 间 就 称 为 此 方法 统计 的 半 误 周期 (Counter Half Life Time) ， 
进行 热度 衰减 的 动作 是 在 虚拟 机 进行 垃圾 收集 时 顺便 进行 的 ， 可 以 使 用 虚拟 机 参数 -XX: -UseCounterDecay 来 关闭 热度 衰减 ， 让 方法 计数 器 统计 方法 调用 的 绝对 次 数 ， 这 样 ， 只 要 系统 运行 时 间 足 够 长 ， 绝 








大 部 分 方法 都 会 被 编译 成 本 





现在 我 们 再 来 看 看 另外 一 个 计数 器 一 一 回 边 计数 器 ， 





也 代码 。 另 外 可 以 使 




















EE 


-XX: CounterHalf 


























LifeTime 参 数 设置 半 衰 周期 的 时 间 ， 单 位 是 秒 。 





边 计数 器 统 














已 


计 的 目的 就 是 为 了 触发 OSR 编 译 。 


于 统计 一 个 方法 中 循环 体 代码 执行 的 次 数 内 ， 在 字 节 码 中 遇 到 控制 流向 后 跳 转 的 指令 就 称 为 “ 回 边 (Back Edge) ” ， 显 然 建立 回 





Java 方 法 入 口 


是 否 存在 已 编译 版 本 





方法 调用 计数 器 值 加 1 执行 编译 后 的 本 地 代码 版 本 









两 计数 器 值 之 和 是 否 
超过 阔 值 


否 问 编 译 器 提交 编译 请 求 


以 解释 方式 执行 方法 


java 方法 返回 





图 11-2 方法 调用 计数 器 触发 即时 编译 




















关于 回 边 计数 器 的 阔 值 ， 虽 然 HotSpot 虚 拟 机 也 提供 了 一 个 类 似 于 方法 调用 计数 器 阔 值 -XX: CompileThreshold 的 参数 -XX: BackEdgeThreshold 供 用 户 设置 ， 但 是 当前 的 虚拟 机 实际 上 并 未 使 用 此 参 
数 ， 因 此 我 们 需要 设置 另外 一 个 参数 -XX: OnStackReplacePercentage 来 间接 调整 回 边 计数 器 的 阔 值 ， 其 计算 公式 为 : 















































“ 虚拟 机 运行 在 Client 模 式 下 ， 回 边 计数 器 阅 值 计算 公式 为 : 方法 调用 计数 器 阔 值 (CompileThreshold) 乘 以 ODSR 比 率 (OnStackReplacePercentage) 除 以 100。 其 中 OnStackReplacePercentage 默 认 值 为 933， 
如 果 都 取 默 认 值 ， 那 Client 模 式 虚 拟 机 的 回 边 计数 器 的 阅 值 为 13995。 


“ 虚拟 机 运行 在 Server 模 式 下 ， 回 边 计数 器 阔 值 的 计算 公式 为 : 方法 调用 计数 器 阅 值 (CompileThreshold) 乘 以 〈OSR 比 率 (OnStackReplacePercentage) 减 去 解释 器 监控 比率 (InterpreterProfilePercentage) 
的 差 值 ) 除 以 100。 其 中 OnStackReplacePercentage 默 认 值 为 140，InterpreterProfilePercentage 上 默认 值 为 33， 如 果 都 取 默 认 值 ， 那 Server 模 式 虚拟 机 回 边 计 数 器 的 阅 值 为 10700。 


当 解 释 器 遇 到 一 条 回 边 指令 时 ， 会 先 查 找 将 要 执行 的 代码 片段 是 否 有 已 经 编译 好 的 版 本 ， 如 果 有 的 话 ， 它 将 会 优先 执行 已 编译 的 代码 ， 否 则 就 把 回 边 计数 器 的 值 加 1， 然 后 判断 方法 调用 计数 器 的 值 与 回 
边 计数 器 的 值 两 者 之 和 是 否 超过 回 边 计数 器 的 阔 值 。 当 超过 阔 值 的 时 候 ， 将 会 提交 一 个 OSR 编 译 请 求 ， 并 且 把 回 边 计数 器 的 值 降 低 一 些 ， 以 便 继 续 在 解释 器 中 执行 循环 ， 等 待 编译 器 输出 编译 结果 ， 整 个 执 
行 过 程 如 图 11-3 所 示 。 











与 方法 计数 器 不 同 ， 回 边 计数 器 没有 计数 热度 衰减 的 过 程 ， 因 此 这 个 计数 器 统计 的 就 是 该 方法 循环 执行 的 绝对 次 数 。 当 计数 器 溢出 的 时 候 ， 它 还 会 把 方法 计数 器 的 值 也 调整 到 溢出 状态 ， 这 样 下 次 再 进 
入 该 方法 的 时 候 就 会 执行 标准 编译 过 程 。 











最 后 需要 提醒 一 点 ， 图 11-2 和 图 11-3 都 仅仅 是 描述 了 Client VM 的 即时 编译 方式 ， 对 于 Server VM 来 说 ， 执 行情 况 会 比 上 面 描述 的 还 要 复杂 。 





11.2.3 ”编译 过 程 


在 默认 设置 下 ， 无 论 是 方法 调用 产生 的 即时 编译 请 求 ， 还 是 OSR 编 译 请 求 ， 虚 拟 机 在 代码 编译 器 还 未 完成 之 前 ， 都 仍然 将 按照 解释 方式 继续 执行 ， 而 编译 动作 则 在 后 台 的 编译 线程 中 进行 。 用 户 可 以 通 
过 参数 -XX: -BackgroundCompilation 来 禁止 后 台 编译 ， 禁 止 后 台 编译 后 ， 当 达到 JIT 的 编译 条 件 ， 执 行 线程 向 虚拟 机 提交 编译 请 求 后 将 会 一 直 等 待 ， 直 到 编译 过 程 完成 后 再 开始 执行 编译 器 输出 的 本 地 代 
码 。 








过 到 回 边 指令 






是 否 存在 已 编译 版 本 
回 边 计 数 器 的 值 加 1 执行 编译 后 的 本 地 代码 版 本 


两 计数 器 值 之 和 是 否 
超过 阔 值 


向 编译 器 提交 0SR 编 译 请 求 
调整 回 边 计数 器 值 


以 解释 方式 继续 执行 














11-3 回 边 计数 器 触发 即时 编译 





那 在 后 台 执行 编译 的 过 程 中 ， 编 译 器 做 了 什么 事情 呢 ? Server Compiler 和 Client Compiler 两 个 编译 器 的 编译 过 程 是 不 一 样 的 。 对 于 Client Compiler 来 说 ， 它 是 一 个 简单 快速 的 三 段 式 编译 器 ， 主 要 的 
关注 点 在 于 局 部 性 的 优化 ， 而 放弃 了 许多 耗 时 较 长 的 全 局 优化 手段 。 





























在 第 一 个 阶段 ， 一 个 平台 独立 的 前 端 将 字 节 码 构造 成 一 种 高 级 中 间 代 码 表示 (High-Level Intermediate Representaion，HIR) 。HIR 使 用 静态 单 分 配 (Static Single Assignment，SSA) 的 形式 来 代 
表 代 码 值 ， 这 可 以 使 得 一 些 在 HIR 的 构造 过 程 之 中 和 之 后 进行 的 优化 动作 更 容易 实现 。 在 此 之 前 编译 器 会 在 字 节 码 上 完成 一 部 分 基础 优化 ， 如 方法 内 联 、 常 量 传播 等 优化 将 会 在 字 节 码 被 构造 成 HIR 之 前 完 
成 。 














在 第 二 个 阶段 ， 一 个 平台 相关 的 后 端 从 HIR 中 产生 低级 中 间 代 码 表示 (Low-Level Intermediate Representation，LIR) ， 而 在 此 之 前 会 在 HIR 上 完成 另外 一 些 优化 ， 如 空 值 检查 消除 、 范 围 检 查 消除 
等 ， 以 便 让 HIR 达 到 更 高 效 的 代码 表示 形式 。 

















最 后 的 阶段 是 在 平台 相关 的 后 端 使 用 线性 扫描 算法 (Linear Scan Register Allocation) 在 LIR 上 分 配 寄存 器 ， 并 在 LIR 上 做 寅 孔 (Peephole) 优化 ， 然 后 产生 机 器 代码 。Client Compiler 的 大 致 执行 过 


程 如 图 11-4 所 示 。 
HIR 到 LIR 转 换 


| 





[Ei 














忧 化 后 的 HIR 


| 


空 值 检查 消除 
范围 检查 消除 


HIR ( SSA 形式 ) | 一 一 > 


前 端 





图 11-4 Client Compiler 架 

















而 Server Compiler 则 是 专门 面向 服务 端的 典型 应 用 并 为 服务 端的 性 能 配置 特别 调整 过 的 编译 器 ， 也 是 一 个 充分 优化 过 的 高 级 编译 器 ， 几 乎 能 达到 GNU C++ 编译 器 使 用 -O2 参 数 时 的 优化 强度 ， 它 会 执 
行 所 有 的 经 典 的 优化 动作 ， 如 : 无 用 代码 消除 (Dead Code Elimination) 、 循 环 展开 (Loop Unrolling) 、 循 环 表达 式 外 提 (Loop Expression Hoisting) 、 公 共 子 表达 式 消 除 (Common 
Subexpression Elimination) 、 常 量 传播 (Constant Propagation) 、 基 本 块 重 排序 (Basic Block Reordering) 等 ， 还 会 实施 一 些 与 java 语言 特性 密切 相关 的 优化 技术 ， 如 范围 检查 消除 (Range 
Check Elimination) 、 空 值 检查 消除 (Null Check Elimination， 不 过 并 非 所 有 的 空 值 检 查 消除 都 是 依赖 编译 器 进行 优化 的 ， 有 一 些 是 在 代码 运行 过 程 中 自动 优化 了 ) 等 。 另 外 ， 还 可 能 根据 解释 器 或 
Client Compiler 提 供 的 性 能 监控 信息 ， 进 行 一 些 不 稳定 的 激进 优化 ， 如 守护 内 联 (Guarded Inlining) 、 分 支 频 率 预 测 (Branch Frequency Prediction) 等 ， 本 章 的 下 半 部 分 将 会 挑选 上 述 的 一 部 分 优化 
手段 进行 分 析 讲解 。 
















































































Server Compiler 的 寄存 器 分 配器 是 一 个 全 局 图 着 色 分 配器 ， 它 可 以 充分 利用 某 些 处 理 器 架构 (如 RISC) 上 的 大 寄存 器 集合 。 以 即时 编译 的 标准 来 看 ，Server Compiler 无 疑 是 比较 缓慢 的 ， 但 它 的 速度 
仍然 远 远 超过 传统 的 静态 优化 编译 器 ， 而 且 它 相对 于 Client Compiler 编 译 输出 的 代码 质量 有 所 提高 ， 可 以 减少 本 地 代码 的 执行 时 间 ， 从 而 抵消 了 额外 的 编译 时 间 开销 ， 所 以 也 有 很 多 非 服务 端的 应 用 选择 使 
Server 模 式 的 虚拟 机 运行 。 


















































11.2.4 ”查看 与 分 析 即 时 编译 结果 

















一 般 来 说 ， 虚 拟 机 的 即时 编译 过 程 对 用 户 程序 是 完全 透明 的 ， 虚 拟 机 通过 解释 执行 代码 还 是 编译 执行 代码 ， 对 于 用 户 来 说 并 没有 什么 影响 (执行 结果 没有 影响 ,速度 上 会 有 很 大 差别 ) ， 大 多 数 情况 下 
也 没有 必要 知道 。 但 是 虚拟 机 也 提供 了 一 些 参 数 用 来 输出 即时 编译 和 某 些 优化 手段 (如 方法 内 联 ) 的 执行 状况 ， 本 节 将 介绍 如 何 从 外 部 观察 虚拟 机 的 即时 编译 行为 。 






























































本 节 中 提 到 的 运行 参数 有 一 部 分 需要 Debug 或 FastDebug 版 虚拟 机 的 支持 ，Product 版 的 虚拟 机 无 法 使 用 这 部 分 参数 。 如 果 读 者 使 用 的 是 根据 本 书 第 一 章 的 教程 自己 编译 的 JDK， 请 注意 将 
SKIP_DEBUG_BUILD 或 SKIP_FASTDEBUG_BUILD 参 数 设置 为 false， 也 可 以 在 OpenJDK 网 站 上 直接 下 载 FastDebug 版 的 JDK。 本 节 中 所 有 的 测试 都 基于 代码 清单 11-2 所 示 的 Java 代 码 。 























代码 清单 11-2 ”测试 代码 





public static final int NUM = 15000; 
public static int doubleValue (int i) { 
etarre 诗 关 27 


} 

public static long calcSum() { 
long sum = 0; 
for (int i = 1; i <= 100; i++) { 
sum += doubleValue (i); 
} 
return sum; 

} 

public static void main (String[] args) { 
for (int 1 = 0; i < NUM; i++) { 
calcSum() 7 














首先 运行 这 段 代 码 ， 并 且 确 认 这 段 代 码 是 否 触发 了 即时 编译 ， 要 知道 某 个 方法 是 否 被 编译 过 ， 可 以 使 
来 ， 如 代码 清单 11-3 所 示 (其 中 带 有 “%” 的 输出 说 明 是 由 回 边 计数 器 触发 的 OSR 编 译 ) 。 














代码 清单 11-3 ”被 即时 编译 的 代码 


参数 -XX: 


+PrintCompilation 要 求 虚拟 机 在 即时 编译 时 将 被 编译 成 本 地 代码 的 方法 名 称 打印 出 





VM option '+PrintCompilation’' 





310 1 java.lang.String: :charAt (33 bytes) 
329 2 org.fenixsoft.jit.Test::calcSum (26 bytes) 
3 3 org.fenixsoft.jit.Test::doubleValue (4 bytes) 
332 1% org.fenixsoft.jit.Test::main @ 5 (20 bytes) 
从 代码 清单 11-3 输 出 的 确认 信息 中 可 以 确认 main(0、calcSum0 和 doubleValue() 方 法 已 经 被 编译 ， 我 们 还 可 以 加 上 参数 -XX: +Printinlining 要 求 虚拟 机 输出 方法 内 联 信息 ， 如 代码 清单 11-4 所 示 。 





代码 清单 11-4 内 联 信息 





VM option '+PrintCompilation' 
VM option '+PrintInlining' 


273 java.lang.String: :charAt (33 bytes) 





291 2 org.fenixsoft.jit.Test::calcSum (26 bytes) 
@9 org.fenixsoft.jit.Test::doubleValue inline (hot) 
294 尝 org.fenixsoft.jit.Test::doubleValue (4 bytes) 
295 1% org.fenixsoft.jit.Test::main @ 5 (20 bytes) 
@5 org.fenixsoft.jit.Test::calcSum inline (hot) 
@9 org.fenixsoft.jit.Test::doubleValue inline (hot) 
从 代码 清单 11-4 的 输出 中 可 以 看 到 方法 doubleValue() 被 内 联 编译 到 calcSum( 中 ， 而 calcSum() 又 被 内 联 编译 到 方法 main0 里 面 ， 所 以 虚拟 机 再 次 执行 main() 方 法 的 时 候 (尽管 main() 方 法 并 不 会 运行 























两 次 ) ，calcSum(0 和 doubleValue() 方 法 都 不 会 再 被 调 有 





， 它 们 的 代码 逻辑 都 被 直接 内 联 到 main() 方 法 里 面 了 。 
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除了 查看 哪些 方法 被 编译 之 外 ， 还 可 以 进一步 查看 即时 编译 器 生成 的 机 器 码 内 容 ， 不 过 如 果 虚 拟 机 输出 一 
读 。 虚 拟 机 提供 了 一 组 通用 的 反 汇编 接口 P， 可 以 接 入 各 种 平台 下 的 反 汇编 适配器 来 使 用 ， 如 使 
sparcv9 等 ， 可 以 下 载 或 自己 编译 出 反 汇 编 适 配器 后 ， 将 其 放置 在 JRE/bin/client 或 /servier 目 录 下 
+PrintAssembly 参 数 要 求 虚拟 机 打印 编译 方法 的 汇编 代码 了 如 果 没有 hsdis 支 持 ， 也 可 以 使 
果 的 中 间 代 码 表 示 ， 代 码 清单 11-2 被 编译 后 部 分 反 汇编 (使 



































， 只 要 与 jvm. 
































代码 清单 11-5 ”本 地 机 器 码 反 汇编 信息 (部 分 ) 


-XX: printOptoAssembly (用 
-XX: +printOptoAssembly) 的 输出 结果 如 代码 清单 11-5 所 示 。 


0 和 1， 对 于 我 们 的 阅读 来 说 是 没有 意义 的 ， 机 器 码 必须 反 汇 编 成 基本 的 汇编 语言 才 可 能 被 阅 


32 位 x86 平 台 则 选用 hsdis-i386 适 配器 名， 其 余 平台 的 适配器 还 有 如 hsdis-amd64、hsdis-sparc 和 hsdis- 





dl 的 路 径 相同 。 为 虚拟 机 安装 了 反 汇 编 适配器 之 后 ， 就 可 以 使 用 -XX: 


于 Client VM) 来 输出 比较 接近 最 终结 








即 可 被 虚拟 机 调用 
于 Server VM) 或 -XX: +print LIR ( 


























000 ” B1: #N1 <- BLOCK HEAD IS JUNK Freq: 1 
000 pushq rbp 
subq rsp, #16# Create frame 


nop# nop for patch verified entry 
006 movl RAX, RDX# spill 


008 sall RAX, #1 
00a addqrsp, 16# Destroy frame 
Popgrbp 


testlrax, [rip + #offset to poll page]# Safepoint: poll for GC 














如 果 除 了 本 地 代码 的 生成 结果 外 ， 还 想 再 进一步 跟踪 本 地 代码 生成 的 具体 过 程 ， 那 还 可 以 使 用 参数 -XX: + 


Compiler) 令 虚 拟 机 将 编译 过 程 中 各 个 阶段 的 数 














Client Compiler) 或 ldeal Graph Visualizerl8] (使 用 Server Compiler) 打开 这 








Compiler Visualizer[7] (使 


居 (如 对 C1 编译 器 来 说 包括 : 字 节 码 、HIR 生 成 、LIR 生 成 、 寄 存 器 分 配 过 程 、 本 地 代码 生成 等 数据 ) 输出 到 文件 中 。 然 后 使 

















Server 





PrintCFGToFile (使 有 








Client Compiler) 或 -XX: PrintldealGraphFile (使 

















Java HotSpot Client 





华北 





居 文 件 进行 分 析 ， 如 图 11-5 所 示 。 
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实际 使 








的 时 候 请 注意 ， 要 输出 CFG 或 1dealGraph 文 件 ， 需 要 一 个 Debug 版 的 虚拟 机 支持 ，Product 版 或 FastDebug 版 的 虚拟 机 无 法 输出 这 些 文件 。 前 面 提 到 的 使 用 -XX: +PrintAssembly 参 数 输出 


11-5 Java HotSpot Client Compiler Visualizer 界 面 





























汇编 信息 也 需要 FastDebug 版 的 虚拟 机 才能 直接 支持 ， 如 果 使 用 Product 版 的 虚拟 机 ， 则 需要 加 入 参数 -XX: +UnlockDiagnosticVMOptions 打 开 虚 拟 机 诊断 模式 后 才能 使 用 。 














1] 作为 三 大 商用 虚拟 机 之 一 的 JRockit 是 个 例外 ， 它 内 部 没有 解释 器 ， 因 此 会 存在 本 书 中 所 说 的 “ 启动 响应 时 间 长 ”之 类 的 缺点 ， 但 它 主要 是 面向 服务 端的 应 用 ， 这 类 应 用 一 般 不 会 重点 关注 启动 时 间 。 

2] Tiered Compilation 的 概念 在 JDK 1.6 时 期 出 现 ， 但 JDK 1.7 之 前 需要 使 用 -XX:+TieredCompilation 参数 来 手动 开启 ， 如 果 不 开启 分 层 编译 策略 ， 而 虚拟 机 又 运行 在 Server 模式 ，Server Compiler 需要 性 能 监控 
信息 提供 编译 依据 ， 则 可 以 由 解释 器 收集 性 能 监控 信息 供 Server Compiler 使 用 。 分 层 编 译 的 相关 资料 可 参见 : http://weblogs.java.net/blog/forax/archive/2010/09/04/tiered-compilation。 

3] 除 这 两 种 方式 外 ， 还 有 其 他 热点 代码 的 探测 方式 ， 如 基于 “踪迹 ” (Trace) 的 热点 探测 在 最 近 相当 流行 ， 像 FireFox 里 的 TraceMonkey 和 Dalvik 里 新 的 JIT 编译 器 都 使 用 这 种 热点 探测 方式 。 

引 准确 地 说 ， 应 当 是 回 边 的 次 数 而 不 是 循环 次 数 ， 因 为 并 非 所 有 的 循环 都 是 回 边 ， 如 空 循 环 实际 上 就 可 以 视 为 自己 跳 转 到 自己 的 过 程 ， 因 此 并 不 算 作 控 制 流向 后 跳 转 ， 也 不 会 被 回 边 计数 器 统计 。 

5] 相关 信息 : http://wikis.sun.com/display/HotSpotInternals/PrintAssembly。 

6] hsdis 的 源码 可 以 从 这 里 获取 : http://hgopenjdk.java.net/jdk7/hotspot/hotspot/file/tip/src/share/tools/hsdis/。 男 外 ， 以 下 地 址 可 以 下 载 到 一 个 已 经 编译 好 了 的 适合 32 位 x86 平台 使 用 的 反 汇 编 适 配器 (此 地 
址 可 能 需要 海外 代理 才能 访问 ) : http://classparset.blogspot.com/2010/03/hsdis-i386dll.html。 此 适配器 在 ITEye 的 高 级 语言 虚拟 机 圈子 的 共享 区 (http://hllvm.group.iteye.com/group/share) 中 也 有 备份 可 以 下 
载 。 
[7 官方 站 点 : http://java.net/projects/clvisualizer/。 








8] 官方 站 点 : http://ssw.jku.at/General/Staff/TW /igv.html。 


11.3 ”编译 优化 技术 




















Java 程 序 员 都 有 一 个 共同 的 认 知 ， 以 编译 方式 执行 本 地 代码 比 解释 方式 更 快 ， 其 中 除去 虚拟 机 解释 执行 字 节 码 时 额外 消耗 的 时 间 以 外 ， 还 有 一 个 很 重要 的 原因 就 是 JDK 设 计 团 队 几 乎 把 对 代码 的 所 有 优 
化 措施 都 集中 在 了 即时 编译 器 之 中 ， 所 以 一 般 来 说 即时 编译 器 产生 的 本 地 代码 会 比 Javac 产 生 的 字 节 码 更 优秀 [1]， 接 下 来 我 们 就 介绍 一 些 Hotspot 虚 拟 机 的 即时 编译 器 在 生成 代码 时 采用 的 代码 优化 技术 。 








11.3.1 ”优化 技术 概览 


























Sun 官 方 的 Wiki 上 ，Hotspot 虚 拟 机 设计 团队 列 出 了 一 个 相对 比较 全 面 的 、 即 时 编译 器 中 采用 的 优化 技术 列表 向 (如 表 11-1 所 示 ) ， 其 中 有 不 少 经 典 编译 器 的 优化 手段 ， 也 有 许多 针对 java 语言 (准确 
地 说 是 针对 运行 在 Java 虚 拟 机 上 的 所 有 语言 ) 本 身 进行 的 优化 技术 ， 本 节 将 对 这 些 技术 进行 一 遍 简 单 的 概览 ， 在 后 面 的 几 节 中 ， 笔 者 将 挑选 若干 最 重要 或 最 典型 的 优化 ， 与 读者 一 起 看 看 优化 前 后 的 代码 发 
生 了 怎样 的 变化 。 


























表 11-1 即时 编译 器 优化 技术 一 览 





优化 技术 
延迟 编译 (delayed compilation ) 


分 层 编译 (tiered compilation ) 


编译 器 策略 栈 上 替换 (on-stack replacement) 
(compiler tactics) 延迟 优化 (delayed reoptimization ) 


程序 依赖 图 表示 (program dependence graph representation) 
静态 单 赋 值 表示 (static single assignment representation) 


并 
LE 











乐观 空 值 断言 (optimistic nullness assertions ) 
乐观 类 型 断言 (optimistic type assertions ) 

乐观 类 型 增强 (optimistic type strengthening) 

基于 性 能 监控 的 优化 技术 乐观 数组 长 度 增强 (optimistic array length strengthening) 
(profile-based techniques) 裁剪 未 被 选择 的 分 支 (untaken branch pruning ) 

乐观 的 多 态 内 联 (optimistic N-morphic inlining) 

分 支 频 率 预 测 (branch frequency prediction) 

调用 频率 预测 (call frequency prediction) 

















基于 证 据 的 优化 技术 


(proof-based techniques) 


优化 技术 
精确 类 型 推断 (exact type inference) 





内 存 值 推断 (memory value inference) 





内 存 值 跟踪 ‘(memory value tracking ) 





常量 折 肥 (constant folding) 

重组 (reassociation) 

操作 符 退 化 (operator strength reduction ) 
空 值 检查 消除 (null check elimination ) 





类 型 检测 退化 (type test strength reduction ) 





类 型 检测 消除 (type test elimination ) 
代数 化 简 (algebraic simplification ) 


公共 子 表达 式 消 除 (common subexpression elimination ) 





数据 流 敏感 重 写 


(flow-sensitive rewrites) 


语言 相关 的 优化 技术 


(language-specific techniques) 


内 存 及 代码 位 置 变换 


(memory and placement transformation ) 


循环 变换 


(loop transformations ) 


条 件 常 量 传播 (conditional constant propagation ) 





基于 流 承载 的 类 型 缩减 转换 (flow-carried type narrowing) 
无 用 代码 消除 (dead code elimination ) 

类 型 继承 关系 分 析 (class hierarchy analysis ) 
去 虚拟 机 化 (devirtualization) 

符号 常量 传播 (symbolic constant propagation ) 
自动 装 箱 消除 (autobox elimination) 

逃逸 分 析 (escape analysis) 

锁 消 除 (lock elision) 

锁 脱 胀 (lock coarsening) 

消除 反射 (de-reflection) 

表达 式 提升 (expression hoisting) 

表达 式 下 沉 (expression sinking) 

宛 余 存储 消除 〈redundant store elimination ) 

相 令 存储 合并 (adjacent store fusion ) 
交汇 点 分 离 (merge-point splitting) 

循环 展开 (loop unrolling) 





循环 判 离 (loop peeling) 

安全 点 消除 〈safepoint elimination ) 

迫 代 范围 分 离 (iteration range splitting) 
范围 检查 消除 (range check elimination) 
循环 向 量化 〈loop vectorization ) 





全 局 代码 调整 
(global code shaping) 


内 联 (inlining) 

全 局 代码 外 提 (global code motion) 
基于 热度 的 代码 布局 (heat-based code layout) 
Switch 调整 (switch balancing) 


一 、 
2 
— 


1 
A 


类 型 优化 技术 
本 地 代码 编排 (local code scheduling) 
本 地 代码 封包 (local code bundling) 
延迟 槽 填充 (delay slot filling) 
着 色 图 寄存 器 分 配 (graph-coloring register allocation ) 
线性 扫描 寄存 器 分 配 (linear scan register allocation) 


复写 聚合 (copy coalescing) 











控制 流 图 变换 
(control flow graph transformation ) 
常量 分 型 (constant splitting ) 


复写 移 除 (copy removal) 

地 址 模式 匹配 (address mode matching) 

指令 宁 孔 优化 (instruction peepholing) 

基于 确定 有 限 状 态 机 的 代码 生成 (DFA-based code generator) 




















上 述 的 优化 技术 看 起 来 很 多 ， 而 且 名 字 看 起 来 都 显得 有 点 “高 深 莫 测 ”， 实 际 上 实现 这 些 优化 也 许 确 实 有 些 难度 ， 但 大 部 分 技术 理解 起 来 都 并 不 困难 ， 笔 者 举 一 个 最 简单 的 例子 来 展示 其 中 几 种 优化 技 
术 是 如 何 发 挥 作 用 的 。 首 先 从 原始 代码 开始 ， 如 代码 清单 11-6 所 示 ]。 




















代码 清单 11-6 ”优化 前 的 原始 代码 





static class B { 
int value; 
final int get() { 
return Value7 


} 
public void foo() { 
y= b.get (); 
// http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/...do stuffhttp://www.hzcourse.com/resource/readBook?path=/openre: 
z= b.get(); 
sum=y+2; 


} 

















首先 需要 明确 一 点 的 是 ， 这 些 代码 的 优化 变换 都 是 建立 在 代码 的 某 种 中 间 表 示 上 ， 绝 不 是 建立 在 Java 源 码 之 上 的 ， 笔 者 为 了 展示 方便 ， 使 用 了 Java 语 言 的 语法 来 表示 这 些 优化 技术 所 发 挥 的 作用 。 















































代码 清单 11-6 的 代码 已 经 非常 简单 了 ， 但 是 仍 有 许多 优化 的 余地 。 首 先进 行 方法 内 联 (Method Inlining) ， 内 联 的 主要 目的 有 两 个 ， 一 是 去 除 方法 调用 的 成 本 (如 建立 栈 帧 等 ) ， 二 是 为 其 他 优化 建 
立 良 好 的 基础 。 方 法 内 联 膨胀 之 后 可 以 便于 在 更 大 范围 上 进行 后 续 的 优化 手段 ， 可 以 获取 更 好 的 优化 效果 ， 因 此 各 种 编译 器 一 般 都 会 把 内 联 优化 放 在 优化 序列 的 靠 前 位 置 。 内 联 后 的 代码 如 代码 清单 11-7 所 





























代码 清单 11-7 ”内 联 后 的 代码 


public void foo() { 
y= b.value; 
// http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/...do stuffhttp://www.hzcourse.com/resource/readBook?path=/openre: 
z= b.value; 
sum=y+2z; 


} 





下 一 步 进行 元 余 访 问 消除 Redundant Loads Elimination) ， 假 设 代码 中 间 注 释 掉 的 “do stuffhttp://www.hzcourse.com/resource/readBook? 
path=/openresources/teach_ebook/uncompressed/13441/OEBPS/Text/..… 所 代表 的 操作 不 会 改变 b.value 的 值 ， 那 就 可 以 把 “z=b.value” 替 换 为 “z=y”， 因 为 上 一 句 “y=b.value” 已 经 保证 了 变 
量 y 与 b.value 是 一 致 的 ， 这 样 就 可 以 不 用 再 去 访问 对 象 b 的 局 部 变量 了 。 如 果 把 b.value 看 做 是 一 个 表达 式 ， 那 也 可 以 把 这 项 优化 看 成 是 公共 子 表达 式 消除 (Common Subexpression Elimination) ， 优 化 
后 的 代码 如 代码 清单 11-8 所 示 。 











代码 清单 11-8 ” 宛 余 存储 消除 的 代码 





public void foo() { 
= b.value; 
// http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/...do stuffhttp://www.hzcourse.com/resource/readBook?path=/openre: 
z=y; 
sum=y+2; 















































第 三 步 我 们 进行 复写 传播 (Copy Propagation) ， 因 为 这 段 程序 的 逻辑 之 中 并 没有 必要 使 用 一 个 额外 的 变量 “z”， 它 与 变量 “y” 是 完全 相等 的 ， 因 此 我 们 可 以 使 用 “y” 来 代替 “z”。 复 写 传播 之 后 
程序 如 代码 清单 11-9 所 示 。 














代码 清单 11-9 ”复写 传播 的 代码 





public void foo() { 


= b.value; 
// http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/...do stuffhttp://www.hzcourse.com/resource/readBook?path=/openre: 
i 


sum=y+y; 


} 




















第 四 步 我 们 再 进行 无 用 代码 消除 (Dead Code Elimination) ， 无 用 代码 可 能 是 永远 不 会 被 执行 的 代码 ， 也 可 能 是 完全 没有 意义 的 代码 。 它 又 被 很 形象 地 称 为 “Dead Code”， 在 代码 清单 11-9 
中 ， “y=y” 是 没有 意义 的 ， 把 它 消除 后 的 程序 如 代码 清单 11-10 所 示 。 
































代码 清单 11-10 ”进行 无 用 代码 消除 的 代码 


public void foo() { 
y= b.value; 
// http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/...do stuffhttp://www.hzcourse.com/resource/readBook?path=/openre: 
sum=y+y; 


} 








经 过 四 次 优化 之 后 ， 代 码 清单 11-10 与 代码 清单 11-6 所 达到 的 效果 是 一 致 的 ， 但 是 前 者 比 后 者 省 略 了 许多 语句 (体现 在 字 节 码 和 机 器 码 指令 上 的 差距 会 更 大 ) ， 执 行 效率 也 更 高 。 编 译 器 的 这 些 优化 技 
术 实 现 起 来 也 许 比较 复杂 ， 但 是 要 理解 它们 的 行为 对 于 一 个 普通 的 程序 员 来 说 是 没有 困难 的 ， 接 下 来 我 们 继续 查看 如 下 的 几 项 优化 技术 是 如 何 运 作 的 ， 它 们 分 别 是 : 


























“ 语言 无 关 的 经 典 优 化 技术 之 一 : 公共 子 表达 式 消 除 
“ 语言 相关 的 经 典 优化 技术 之 一 : 数组 范围 检查 消除 
最 重要 的 优化 技术 之 一 : 方法 内 联 


“ 最 前 沿 的 优化 技术 之 一 : 逃 选 分析 


11.3.2 ”公共 子 表达 式 消除 























公共 子 表达 式 消除 是 一 个 普遍 应 用 于 各 种 编译 器 的 经 典 优化 技术 ， 它 的 含义 是 : 如 果 一 个 表达 式 E 已 经 被 计算 过 了 ， 并 且 从 先前 的 计算 到 现在 E 中 所 有 变量 的 值 都 没有 发 生变 化 ， 那 么 E 的 这 次 出 现 就 成 
为 了 公共 子 表达 式 。 对 于 这 种 表达 式 ， 没 有 必要 花 时间 再 对 它 进行 计算 ， 只 需要 直接 用 前 面 计算 过 的 表达 式 结果 代 蔡 E 就 可 以 了 。 如 果 这 种 优化 仅 限于 程序 的 基本 块 内 ， 便 称 为 局 部 公共 子 表达 式 消除 
(Local Common Subexpression Elimination) ， 如 果 这 种 优化 的 范围 涵盖 了 多 个 基本 块 ， 那 就 称 为 全 局 公共 子 表 达 式 消除 (Global Common Subexpression Elimination) 。 举 个 简单 的 例子 来 说 明 它 
的 优化 过 程 ， 假 设 存在 如 下 代码 : 






























































od] 























int 有 d= (G0 *D) 12+ (到 二 DbD * 忆 )3 





如 果 这 段 代 码 交 给 Javac 编 译 器 则 不 会 进行 任何 优化 ， 那 生成 的 代码 将 如 代码 清单 11-11 所 示 ， 是 完全 遵照 Jjava 源 码 的 写法 直译 而 成 的 。 














代码 清单 11-11 未 作 任何 优化 的 字 节 码 





iload 2 | 

imul // 计算 b*c 

bipush 12 // 推 入 12 

imul // 计算 (c * b) * 12 
iload 1 //a 

iadd // 计算 (ec * bj) * 12 + a 
iload 1 2 

iload 2 2 

iload 3 J 

imul // 计算 b * © 

iadd // 计算 a + b * 

iadd // 计算 (Cc *b)*12+ata+b*e 
istore 4 











当 这 段 代码 进入 到 虚拟 机 即时 编译 器 后 ， 它 将 进行 如 下 优化 : 编译 器 检测 到 “c*b” 与 “b*c” 是 一 样 的 表达 式 ， 而 且 在 计算 期 间 b 与 c 的 值 是 不 变 的 。 因 此 这 条 表达 式 就 可 能 被 视 为 : 











int d=E*12+a+ (a+E); 

















这 时 候 ， 编 译 器 还 可 能 (取决 于 哪 种 虚拟 机 的 编译 器 及 具体 的 上 下 文 ) 进行 另外 一 种 优化 : 代数 化 简 (Algebraic Simplification) ， 把 表达 式 变 为 : 








人 














表达 式 进行 变换 之 后 ， 再 计算 起 来 就 可 以 节省 一 些 时 间 了 。 如 果 您 还 对 其 他 的 经 典 编译 优化 技术 感 兴趣 ， 可 以 参考 《编译 原理 》 (俗称 龙 书 ， 推 荐 使 用 java 的 程序 员 看 2006 年 版 的 紫 龙 书 ) 中 的 相关 章 


让 
DD。 














11.3.3 ”数组 边界 检查 消除 


数组 边界 检查 消除 (Array Bounds Checking Elimination) 是 即时 编译 器 中 的 一 项 语言 相关 的 经 典 优化 技术 。 我 们 知道 Java 语 言 是 一 门 动态 安全 的 语言 ， 对 数组 的 读 写 访问 也 不 像 C、C++ 那 样本 质 上 
是 裸 指 针 操作 。 如 果 有 一 个 数组 fool ， 在 Java 语 言 中 访问 数组 元 素 foofi] 的 时 候 系统 将 会 自动 进行 上 下 界 的 范围 检查 ， 即 检查 i 必 须 满足 >=0&&i<foo.length 的 这 个 条 件 ， 和 否则 将 抛 出 一 个 运行 时 异常 : 
java.lang.ArraylndexOutOfBoundsException。 这 对 软件 开发 者 来 说 是 一 件 很 好 的 事情 ， 即 使 程序 员 没有 专门 编写 防御 代码 ， 也 可 以 避免 大 部 分 的 溢出 攻击 。 但 是 对 于 虚拟 机 的 执行 子 系统 来 说 ， 每 次 数 
组 元 素 的 读 写 都 带 有 一 次 隐 含 的 条 件 判定 操作 ， 对 于 拥有 大 量 数组 访问 的 程序 代码 ， 这 无 疑 也 是 一 种 性 能 负担 。 















































无 论 如 何 ， 为 了 安全 ， 数 组 边界 检查 肯定 是 必须 做 的 ， 但 数组 边界 检查 是 不 是 必须 在 运行 期 间 一 次 不 漏 地 检查 则 是 可 以 “商量 ”的 事情 。 例 如 这 个 简单 的 情况 : 数组 下 标 是 一 个 常量 ， 如 foo[3]， 只 要 
在 编译 期 根据 数据 流 分 析 来 确定 foo.length 的 值 ， 并 判断 下 标 “3” 没 有 越界 ， 执 行 的 时 候 就 无 须 判断 了 。 更 加 常见 的 情况 是 数组 访问 发 生 在 循环 之 中 ， 并 且 使 用 循环 变量 来 进行 的 数组 访问 ， 如 果 编 译 器 只 
要 通过 数据 流 分 析 就 可 以 判定 循环 变量 的 取 值 范围 永远 在 区 闻 [0，foo.length) 之 内 ， 那 在 整个 循环 中 就 可 以 把 数组 的 上 下 界 检查 消除 掉 ， 这 可 以 节省 很 多 次 的 条 件 判断 操作 。 













































































与 语言 相关 的 其 他 消除 操作 还 有 不 少 ， 如 自动 装 箱 消除 (Autobox Elimination) 、 安 全 点 消除 (Safepoint Elimination) 、 消 除 反射 (Dereflection) 等 ， 笔 者 就 不 再 一 一 介绍 了 。 





11.3.4 方法 内 联 





























在 前 面 的 讲解 中 我 们 提 到 过 方法 内 联 ， 它 是 编译 器 最 重要 的 优化 手段 之 一 ， 除 了 消除 方法 调用 的 成 本 之 外 ， 它 更 重要 的 意义 是 为 其 他 优化 手段 建立 良好 的 基础 ， 如 下 面 代码 清单 11-12 所 示 的 简单 例子 
就 揭示 了 内 联 对 其 他 优化 手段 的 意义 : 事实 上 testlnline() 方 法 的 内 部 全 部 都 是 无 用 的 代码 ， 如 果 不 做 内 联 ， 后 续 即 使 进行 了 无 用 代码 消除 的 优化 ， 也 无 法 发 现任 何 “Dead Code”， 因 为 如 果 分 开 来 
看 ，foo0 和 testlnline() 两 个 方法 里 面 的 操作 都 可 能 是 有 意义 的 。 

























































































代码 清单 11-12 ”未 作 任 何 优化 的 字 节 码 


public static void foo (Object obj) { 
if (obj != null) { 
System.out .println("do something"); 
i 
} 
public static void testInline (String[] args) { 
Object obj = null; 
foo (obj) 
} 























方法 内 联 的 优化 行为 看 起 来 很 简单 ， 不 过 是 把 目标 方法 的 代码 “复制 ”到 发 起 调用 的 方法 之 中 ， 避 免 发 生 真实 的 方法 调用 而 已 。 但 实际 上 Java 虚 拟 机 中 的 内 联 过 程 远 远 没 有 那么 简单 ， 因 为 如 果 不 是 即 
时 编译 器 做 了 一 些 特别 的 努力 ， 按 照 经 典 编译 原理 的 优化 理论 ， 大 多 数 的 Java 方 法 都 无 法 进行 内 联 ! 


















































无 法 内 联 的 原因 其 实在 前 面 第 8 章 中 讲解 Java 方 法 解析 和 分 派 调用 的 时 候 就 已 经 说 过 。 只 有 使 用 invokespecial 指 令 调 用 的 私有 方法 、 实 例 构 造 器 、 父 类 方法 和 使 用 invokestatic 指 令 进行 调用 的 静态 方法 
才 是 在 编译 期 进行 解析 的 ， 除 了 上 述 四 种 方法 之 外 ， 其 他 的 Java 方 法 调用 都 需要 在 运行 时 进行 方法 接收 者 的 多 态 选择 ， 并 且 都 有 可 能 存在 多 于 一 个 版 本 的 方法 接收 者 (最 多 再 除去 被 final 修 饰 的 方法 这 种 特 
殊 情 况 ， 尽 管 它 使 用 invokevirtual 指 令 调用 ， 但 也 是 非 虚 方法 ，Java 语 言 规范 中 明确 说 明了 这 点 ) ， 简 而 言 之 ，Java 语 言 中 默认 的 实例 方法 就 是 虚 方 法 。 




















































































































对 于 一 个 虚 方法 ， 编 译 器 做 内 联 的 时 候 根本 就 无 法 确定 应 该 使 用 哪个 方法 版 本 ， 例 如 ， 前 面 代 码 清单 11-7 中 的 把 “b.get(0” 内 联 为 “b.value” ， 就 是 不 依赖 上 下 文 就 无 法 确定 b 的 实际 类 型 是 什么 。 假 
如 有 ParentB 和 SubB 两 个 具有 继承 关系 的 类 ， 并 且 子 类 重 写 了 父 类 的 get() 方 法 ， 那 么 ， 是 要 执行 父 类 的 get() 方 法 还 是 子 类 的 get() 方 法 ， 需 要 在 运行 期 才能 确定 ， 编 译 期 无 法 得 出 结论 。 


































































































由 于 Java 语 言 提 倡 使 用 面向 对 象 的 编程 方式 进行 编程 ， 而 Java 对 象 的 方法 默认 就 是 虚 方法 ， 因 此 Java 间 接 鼓 励 了 程序 员 使 用 大 量 的 虚 方法 来 完成 程序 逻辑 。 根 据 我 们 上 面 的 分 析 ， 内 联 与 虚 方法 之 间 会 
产生 “矛盾 ”， 那 该 怎么 办 呢 ? 是 不 是 为 了 提高 执行 性 能 ， 就 要 到 处 使 用 final 关 键 字 去 修饰 方法 呢 ? 










































































为 了 解决 虚 方法 的 内 联 问题 ，Java 虚 拟 机 设计 团队 想 了 很 多 办 法 ， 首 先是 引入 了 一 种 名 为 “类 型 继承 关系 分 析 ” (Class Hierarchy Analysis，CHA) 的 技术 ， 这 是 一 种 基于 整个 应 用 程序 的 类 型 分 析 技 
术 ， 它 用 于 确定 在 目前 已 加 载 的 类 中 ， 某 个 接口 是 否 有 多 于 一 种 的 实现 ， 某 个 类 是 否 存在 子 类 且 子 类 是 否 为 抽象 类 等 信息 。 





























编译 器 在 进行 内 联 时 ， 如 果 是 非 虚 方法 ， 那 么 直接 进行 内 联 就 可 以 了 ， 这 时 候 的 内 联 是 有 稳定 前 提 保障 的 。 如 果 遇 到 虚 方法 ， 则 会 向 CHA 查 询 此 方法 在 当前 程序 下 是 否 有 多 个 目标 版 本 可 供 选 择 ， 如 果 
查询 结果 只 有 一 个 版 本 ， 那 也 可 以 进行 内 联 ， 不 过 这 种 内 联 就 属于 激进 优化 ， 需 要 预 留 一 个 “逃生 门 ” (Guard 条 件 不 成 立时 的 Slow Path) ， 称 为 守护 内 联 (Guarded Inlining) 。 如 果 程 序 的 后 续 执行 
过 程 中 ， 虚 拟 机 一 直 没有 加 载 到 会 令 这 个 方法 的 接收 者 的 继承 关系 发 生变 化 的 类 ， 那 这 个 内 联 优化 的 代码 就 可 以 一 直 使 用 下 去 。 但 是 如 果 加 载 了 导致 继承 关系 发 生变 化 的 新 类 ， 那 就 需要 抛弃 掉 已 经 编译 的 
代码 ， 退 回 到 解释 状态 执行 ， 或 者 重新 进行 编译 。 















































如 果 向 CHA 查 询 出 来 的 结果 是 有 多 个 版 本 的 目标 方法 可 供 选 择 ， 则 编译 器 还 将 会 进行 最 后 一 次 努力 ， 使 用 内 联 缓存 (Inline Cache) 来 完成 方法 内 联 ， 这 是 一 个 建立 在 目标 方法 正常 入 口 之 前 的 缓存 ， 
它 的 工作 原理 大 致 是 : 在 未 发 生 方法 调用 之 前 ， 内 联 缓存 状态 为 空 ， 当 第 一 次 调用 发 生 后 ， 缓 存 记录 下 方法 接收 者 的 版 本 信息 ， 并 且 ， 每 次 进行 方法 调用 时 都 比较 接收 者 版 本 ， 如 果 以 后 进来 的 每 次 调用 的 
方法 接收 者 版 本 都 是 一 样 的 ， 那 这 个 内 联 还 可 以 一 直 用 下 去 。 如 果 发 生 了 方法 接收 者 不 一 致 的 情况 ， 就 说 明 程 序 真正 使 用 到 了 虚 方 法 的 多 态 特 性 ， 这 时 候 才 会 取消 内 联 ， 查 找 虚 方法 表 进 行 方法 分 派 。 





























































































































所 以 说 ， 在 许多 情况 下 虚拟 机 进行 的 内 联 都 是 一 种 激进 优化 ， 激 进 优化 的 手段 在 高 性 能 的 商用 虚拟 机 中 很 常见 ， 除 了 内 联 之 外 ， 对 于 出 现 概率 很 小 〈 通 过 经 验 数据 或 解释 器 收集 到 的 性 能 监控 信息 确定 
概率 大 小 ) 的 隐 式 异常 、 使 用 概率 很 小 的 分 支 等 都 可 以 被 激进 优化 “ 移 除 ” 掉 ， 如 果真 的 出 现 了 小 概率 事件 ， 这 时 才 会 从 “逃生 门 ” 回 到 解释 状态 重新 执行 。 






























































11.3.5 “逃逸 分 析 














逃逸 分 析 (Escape Analysis) 是 目前 Java 虚 拟 机 中 比较 前 沿 的 优化 技术 ， 它 与 类 型 继承 关系 分 析 一 样 ， 并 不 是 直接 优化 代码 的 手段 ， 而 是 为 其 他 优化 手段 提供 依据 的 分 析 技 术 。 
























































逃逸 分 析 的 基本 行为 就 是 分 析 对 象 动态 作用 域 : 当 一 个 对 象 在 方法 里 面 被 定义 后 ， 它 可 能 被 外 部 方法 所 引用 ， 例 如 作为 调用 参数 传递 到 其 他 方法 中 ， 这 种 行为 称 为 方法 逃逸 。 甚 至 还 有 可 能 被 外 部 线程 
访问 到 ， 璧 如 赋值 给 类 变量 或 可 以 在 其 他 线程 中 访问 的 实例 变量 ， 这 种 行为 称 为 线程 逃逸。 





























如 果 能 证 明 一 个 对 象 不 会 逃逸 到 方法 或 线程 之 外 ， 也 就 是 别 的 方法 或 线程 无 法 通过 任何 途径 访问 到 这 个 对 象 ， 则 可 能 为 这 个 变量 进行 一 些 高 效 的 优化 ， 如 : 


“ 栈 上 分 配 (Stack Allocations) : Java 庶 拟 机 中 ， 在 Java 堆 上 分 配 创建 对 象 的 内 存 空 间 几 乎 是 Java 程 序 员 都 清楚 的 常识 了 ，Java 扒 中 的 对 象 对 于 各 个 线程 都 是 共享 和 可 见 的 ， 只 要 持 有 这 个 对 象 的 引用 ， 就 
可 以 访问 扒 中 存储 的 对 象 数据 。 虚 拟 机 的 垃圾 收集 系统 可 以 回收 掉 堆 中 不 再 使 用 的 对 象 ， 但 回收 动作 无 论 是 筛选 可 回收 对 象 ， 还 是 回收 和 整理 内 存 都 需要 耗费 时 间 。 如 果 确定 一 个 对 象 不 会 逃逸 出 方法 之 
外 ， 那 让 这 个 对 象 在 栈 上 分 配 内 存 将 会 是 一 个 很 不 错 的 主意 ， 对 象 所 占用 的 内 存 空 间 就 可 以 随 栈 帧 出 栈 而 销毁 。 在 一 般 应 用 中 ， 不 会 逃逸 的 局 部 对 象 所 占 的 比率 很 大 ， 如 果 能 使 用 栈 上 分 配 ， 那 大 量 的 对 象 
就 会 随 着 方法 的 结束 而 自动 销毁 了 ， 垃 圾 收集 系统 的 压力 将 会 小 很 多 。 


“ 同步 消除 (Synchronization Elimination) : 线程 同步 本 身 就 是 一 个 相对 耗 时 的 过 程 ， 如 果 逃 选 分 析 能 够 确定 一 个 变量 不 会 逃 包 出 线程 ， 无 法 被 其 他 线程 访问 ， 那 这 个 变量 的 读 写 肯 定 就 不 会 有 竞争 ， 对 
这 个 变量 实施 的 同步 措施 也 就 可 以 消除 掉 。 


“ 标量 替换 (Scalar Replacement) : 标量 (Scalar) 是 指 一 个 数据 已 经 无 法 再 分 解 成 更 小 的 数据 来 表示 了 ，jJava 虚 拟 机 中 的 原始 数据 类 型 (int、long 等 数值 类 型 及 reference 类 型 等 ) 都 不 能 再 进一步 分 解 ， 
它们 就 可 以 被 称 为 标量 。 相 对 的 ， 如 果 一 个 数据 可 以 继续 分 解 ， 那 它 就 被 称 做 聚合 量 (Aggregate) ，Java 中 的 对 象 就 是 最 典型 的 聚合 量 。 如 果 把 一 个 Java 对 象 拆散 ， 根 据 程 序 访问 的 情况 ， 将 其 使 用 到 的 成 员 
变量 恢复 原始 类 型 来 访问 就 叫做 标量 替换 。 如 果 逃 选 分 析 证 明 一 个 对 象 不 会 被 外 部 访问 ， 并 且 这 个 对 象 可 以 被 拆散 的 话 ， 那 程序 真正 执行 的 时 候 将 可 能 不 创建 这 个 对 象 ， 而 改 为 直接 创建 它 的 若干 个 被 这 个 
方法 使 用 到 的 成 员 变 量 来 代替 。 将 对 象 折 分 后 ， 除 了 可 以 让 对 象 的 成 员 变 量 在 栈 上 ( 栈 上 存储 的 数据 ， 很 大 机 会 会 被 虚拟 机 分 配 至 物理 机 器 的 高 速 寄存 器 中 存储 ) 分 配 和 读 写 之 外 ， 还 可 以 为 后 续 进 一 步 的 
优化 手段 创建 条 件 。 





逃逸 分 析 在 Sun JDK 1.6 中 实现 ， 但 是 现在 这 项 优化 尚未 成 熟 ， 仍 有 巨大 的 改进 余地 。 不 成 熟 的 原因 主要 是 不 能 保证 逃逸 分 析 的 性 能 收益 必定 高 于 它 的 消耗 。 如 果 要 百分之百 准确 地 判断 一 个 对 象 是 否 会 
逃逸 ， 需 要 进行 数据 流 敏 感 的 复杂 分 析 ， 来 确定 程序 各 个 分 支 执行 时 对 此 对 象 的 影响 。 这 是 一 个 相对 高 耗 时 的 过 程 ， 如 果 分 析 完 后 发 现 没 有 几 个 不 逃逸 的 对 象 ， 那 时 间 就 白白 浪费 了 ， 所 以 目前 虚拟 机 只 能 
采用 不 那么 准确 ， 但 时 间 压 力 相对 较 小 的 算法 来 完成 逃 锡 分析。 还 有 一 点 是 基于 逃逸 分 析 的 一 些 优化 手段 ， 如 上 面 提 到 的 “ 栈 上 分 配 ”， 由 于 HotSpot 虚 拟 机 目前 的 实现 方式 导致 栈 上 分 配 实现 起 来 比较 复 
此 在 HotSpot 中 暂时 还 没有 做 这 项 优化 。 
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在 测试 结果 上 ， 实 施 逃 逸 分 析 后 的 程序 在 MicroBenchmarks 中 往往 能 运行 出 不 错 的 成 绩 ， 但 是 在 实际 的 应 用 程序 ， 尤 其 是 大 型 程序 中 ， 反 而 发 现实 施 逃 逸 分 析 可 能 会 出 现 效果 不 稳定 的 情况 ， 或 因 分 析 
过 程 耗 时 却 无 法 有 效 地 判别 出 非 逃 逸 对 象 而 导致 性 能 (即时 编译 的 收益 ) 有 所 下 降 ， 所 以 即使 是 Server Compiler， 也 默认 不 开启 逃逸 分 析 内 ， 甚 至 在 某 些 版 本 (如 JDK 1.6Update 18) 中 还 曾经 短暂 地 完 
全 禁止 了 这 项 优化 。 






































如 果 有 需要 ， 并 且 确 认 对 程序 运行 有 益 ， 用 户 可 以 使 用 参数 -XX: +DoEscapeAnalysis 来 手动 开启 逃逸 分 析 ， 开 启 之 后 可 以 通过 参数 -XX: +PrintEscapeAnalysis 来 查看 分 析 结果 。 另 外 ， 用 户 可 以 使 有 
参数 -XX: +EliminateAllocations 来 开启 标量 替换 ， 使 用 参数 +XX: +EliminateLocks 来 开启 同步 消除 ， 使 用 参数 -XX: +PrintEliminateAllocations 来 查看 标量 的 替换 情况 。 
















































































尽管 目前 逃逸 分 析 的 技术 仍 未 完全 成 熟 ， 它 却 是 即时 编译 器 优化 技术 的 一 个 重要 的 发 展 方向 ， 在 日 后 的 虚拟 机 中 ， 逃 逸 分 析 技术 肯定 会 支撑 起 一 系列 实用 有 效 的 优化 技术 。 

















[由 本 地 代码 与 字 节 码 两 者 是 无 法 直接 比较 的 ， 准 确 地 说 应 当 是 指 : 由 编译 器 优化 得 到 的 本 地 代码 与 由 解释 器 解释 字 节 码 后 实际 执行 的 本 地 代码 之 间 的 对 比 。 
D] 地 址 : http://wikis.sun.com/display/HotSpotInternals/PerformanceTacticIndex。 
[3] 本 例 修 改 自 : http://download.oracle.com/docs/cd/E13150_01/jrockit_jvm/jrockit/geninfo/diagnos/underst_jit.html。 


团 初稿 完成 之 前 ， 在 最 新 的 JDK 1.6 Update 23 的 Server Compiler 中 已 默认 开启 了 逃 选 分 析 。 


11.4 _ Java 与 C/C++ 的 编译 器 对 比 














大 多 数 程序 员 都 认为 C/C+ + 会 比 Java 语 言 快 ， 甚 至 觉得 从 Java 语 言 诞生 以 来 ，“ 执 行 速度 缓慢 ”的 帽子 就 应 当 被 扣 在 头顶 ， 这 种 观点 的 出 现 是 由 于 Java 刚 出 现 的 时 候 即时 编译 技术 还 不 成 熟 ， 主 要 靠 解 











释 器 执行 的 Java 语 言 性 能 确实 比较 低下 。 但 是 在 今天 即时 编译 技术 已 经 发 展 成 熟 ，Java 语 言 有 可 能 在 速度 上 与 C/C++ 一 争 高 下 吗 ? 要 想 知 道 这 个 问题 的 答案 得 从 两 者 的 编译 器 谈 起 [1]。 








Java 与 C/C++ 的 编译 器 对 比 实 际 上 代表 了 最 经 典 的 即时 编译 器 与 静态 编译 器 的 对 比 ， 很 大 程度 上 也 决定 了 Java 与 C/C++ 的 性 能 对 比 的 结果 ， 因 为 无 论 是 C/C++ 还 是 Java 代 码 ， 最 终 编译 之 后 被 机 器 执 
行 的 都 是 本 地 机 器 码 ， 哪 种 语言 的 性 能 更 高 ， 除 了 它们 自身 的 ApPl 库 实现 得 好 坏 以 外 ， 其 余 的 比较 就 成 了 一 场 “ 拼 编译 器 ”和 “ 拼 输 出 代码 质量 ”的 游戏 。 当 然 ， 这 种 比较 也 是 剔除 了 开发 效率 的 片面 对 比 ， 
语言 间 熟 优 熟 攻 、 谁 快 谁 慢 的 问题 都 是 很 蕉 有 结果 的 争论 ， 下 面 我 们 就 回 到 正题 ， 看 看 这 两 种 语言 的 编译 器 各 有 何 种 优势 。 















































Java 虚 拟 机 的 即时 编译 器 与 C/C+ + 的 静态 优化 编译 器 相 比 ， 可 能 会 由 于 下 列 这 些 原因 导致 输出 的 本 地 代码 有 一 些 劣势 (下 面 列 举 的 也 包括 一 些 虚 拟 机 执行 子 系统 的 性 能 劣势 ) : 


















































首先 ， 因 为 即时 编译 器 运行 占用 的 是 用 户 程序 的 运行 时 间 ， 具 有 很 大 的 时 间 压 力 ， 它 能 提供 的 优化 手段 也 严重 受制 于 编译 成 本 。 如 果 编 译 速度 不 能 达到 要 求 ， 那 用 户 将 在 启动 程序 或 程序 的 某 部 分 察觉 
重大 延迟 ， 这 点 使 得 即时 编译 器 不 敢 随 便 引 入 大 规模 的 优化 技术 ， 而 编译 的 时 间 成 本 在 静态 优化 编译 器 中 并 不 是 主要 的 关注 点 。 
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其 次 ，Java 语 言 是 动态 的 类 型 安全 语言 ， 这 就 意味 着 需要 由 虚拟 机 来 确保 程序 不 会 违反 语言 的 语义 或 访问 非 结构 化 内 存 。 在 实现 层面 上 看 ， 这 就 意味 着 虚拟 机 必须 频繁 地 进行 动态 检查 ， 如 实例 方法 访 
问 时 检查 空 指 针 、 数 组 元 素 访问 时 检查 上 下 界 范围 、 类 型 转换 时 检查 继承 关系 ， 等 等 。 对 于 这 类 程序 代码 没有 明确 写 出 的 检查 行为 ， 尽 管 编译 器 会 努力 进行 优化 ， 但 是 总 体 上 仍然 要 消耗 不 少 的 运行 时 间 。 









































第 三 ，Java 语 言 中 虽然 没有 virutal 关 键 字 ， 但 是 使 用 虚 方法 的 频率 却 远 远大 于 C/C+ + 语言 ， 这 就 意味 着 运行 时 对 方法 接收 者 进行 多 态 选择 的 频率 要 远 远大 于 C/C+ + 语言 ， 也 意味 着 即时 编译 器 在 进行 一 
些 优化 (如 前 面 提 到 的 方法 内 联 ) 时 的 难度 要 远 远 大 于 C/C+ + 的 静态 优化 编译 器 。 


























第 四 ，Java 语 言 是 可 以 动态 扩展 的 语言 ， 运 行 时 加 载 新 的 类 可 能 改变 程序 类 型 的 继承 关系 ， 这 使 得 很 多 全 局 的 优化 都 难以 进行 ， 因 为 编译 器 无 法 看 见 程序 的 全 钥 ， 许 多 全 局 的 优化 措施 都 只 能 以 激进 优 
化 的 方式 来 完成 ， 编 译 器 不 得 不 时 刻 注意 并 随 着 类 型 的 变化 而 在 运行 时 撤销 或 重新 进行 一 些 优化 。 























第 五 ，Java 语 言 中 对 象 的 内 存 分 配 都 是 在 堆 上 进行 的 ， 只 有 方法 中 的 局 部 变量 才能 在 栈 上 分 配 牛 。 而 C/C++ 的 对 象 则 有 多 种 内 存 分 配方 式 ， 既 可 能 在 堆 上 分 配 ， 又 可 能 在 栈 上 分 配 ， 如 果 可 以 在 栈 上 分 
配 线程 私有 的 对 象 ， 将 减轻 内 存 回 收 的 压力 。 另 外 ，C/C+ + 中 主要 由 用 户 程序 代码 来 回收 分 配 的 内 存 ， 这 就 不 存在 无 用 对 象 筛选 的 过 程 ， 因 此 效率 上 ( 仪 指 运行 效率 ， 排 除了 开发 效率 ) 也 比 垃圾 收集 机 制 
要 高 。 


























上 面 说 了 一 大 堆 Java 语 言 相 对 C/C++ 的 劣势 ， 倒 不 是 说 Java 就 真 的 不 如 C/C+ + 了 ， 相 信 读 者 也 注意 到 了 ，Java 语 言 的 这 些 性 能 上 的 劣势 都 是 为 了 换取 开发 效率 上 的 优势 而 付出 的 代价 ， 动 态 安 全 、 动 态 
扩展 、 垃 圾 回收 这 些 “ 拖 后 腿 ”的 特性 都 为 Java 语 言 的 开发 效率 做 出 了 很 大 的 贡献 。 何 况 ， 还 有 Java 的 即时 编译 器 能 做 ， 而 C/C++ 的 静态 优化 编译 器 不 能 做 的 优化 : 由 于 C/C++ 编 译 器 的 静态 特性 ， 以 运行 
期 性 能 监控 为 基础 的 优化 措施 它 都 无 法 进行 ， 如 调用 频率 预测 (Call Frequency Prediction) 、 分 支 频 率 预测 (Branch Frequency Prediction) 、 裁 前 未 被 选择 的 分 支 (Untaken Branch Pruning) 等 ， 
这 些 都 会 成 为 Java 语 言 独 有 的 性 能 优势 。 












































[由 C/C++ 与 Java 就 优 就 劣 、 谁 快 谁 慢 这 类 话题 已 经 争论 了 十 几 年 ， 双 方 的 支持 者 们 从 来 都 没有 说 服 过 对 方 ， 有 朋友 好 意 提醒 过 笔者 不 要 跳 入 这 种 语言 性 能 争论 的 “ 火 坑 ”， 把 这 节 移 除 掉 。 笔 者 在 此 也 特别 
说 明 ， 本 节 的 目的 仅 是 从 编译 和 执行 的 角度 来 探讨 两 者 的 差异 ， 而 不 是 去 评判 就 优 就 劣 。 
D] Java 中 非 逃 选 对 象 的 标量 替换 优化 可 以 看 做 是 一 种 高 度 优化 后 的 栈 上 分 配 ， 但 它 相 当 于 把 对 象 拆散 成 局 部 变量 再 进行 的 栈 上 分 配 ， 而 不 是 C/C++ 那 种 程序 代码 可 控 的 栈 上 分 配方 式 。 


11.5 本章 小 结 








第 10 章 和 第 11 章 两 章 分 别 介绍 了 Java 程 序 从 源码 编译 成 字 节 码 和 从 字 节 码 编译 成 本 地 机 器 码 的 过 程 ，Javac 字 节 码 编译 器 与 虚拟 机 内 的 川 编译 器 的 执行 过 程 合并 起 来 其 实 就 等 同 于 一 个 传统 的 编译 器 所 
执行 的 编译 过 程 。 





本 章 中 ， 我 们 着 重 了 解 了 虚拟 机 的 热点 探测 方法 、HotSpot 的 即时 编译 器 、 编 译 触 发 条 件 ， 以 及 如 何 从 虚拟 机 外 部 观察 和 分 析 JIT 编 译 的 数据 和 结果 ， 还 选择 了 几 种 常见 的 编译 期 优化 技术 进行 讲解 ， 对 
Java 编 译 器 的 深入 了 解 ， 有 助 于 在 工作 中 分 辨 哪些 代码 是 编译 器 可 以 帮 我 们 处 理 的 ， 哪 些 代码 需要 自己 调节 以 便 更 适合 编译 器 的 优化 。 








第 五 部 分 高效 并 发 


第 12 章 Java 内 存 模型 与 线程 


第 13 章 ”线程 安全 与 锁 优化 


第 12 章 Java 内存 模型 与 线程 





本 章 主要 内 容 

- 概述 

“ 硬件 的 效率 与 一 致 性 
“Java 内 存 模型 


"Java 与 线程 














并 发 处 理 的 广泛 应 用 是 使 得 Amdahl 定 律 代 蔡 摩尔 定律 成 为 计算 机 性 能 发 展 源 动力 的 根本 原因 ， 也 是 人 类 压榨 计算 机 运算 能 力 最 有 力 的 武器 。 


























[由 Amdahl 定律 通过 系统 中 并 行 化 与 串 行 化 的 比重 来 描述 多 处 理 器 系统 能 获得 的 运算 加 速 能 力 ， 摩 尔 定律 则 用 于 描述 处 理 器 晶体 管 数量 与 运行 效率 之 间 的 发 展 关 系 。 这 两 个 定律 的 更 替代 表 了 近年 来 硬件 发 展 
从 追求 处 理 器 频率 到 追求 多 核心 并 行 处 理 的 发 展 过 程 。 





12.1 概述 


多 任务 处 理 在 现代 计算 机 操作 系统 中 几乎 已 是 一 项 必 备 的 功能 了 。 在 许多 情况 下 ， 让 计算 机 同时 去 做 几 件 事情 ， 不 仅 是 
的 存储 和 通讯 子 系统 速度 的 差距 太 大 ， 大 部 分 时 间 都 花 在 了 磁盘 /O、 网 络 通讯 和 数据 库 访 问 上 。 如 果 不 希望 处 理 器 在 大 部 分 时 间 里 都 处 于 等 待 其 他 资源 的 状态 ， 就 必须 使 























为 计算 机 的 运算 能 力 强 大 了 ， 还 有 一 个 很 重要 的 原 






































力 “上 压榨” 出来， 否则 就 会 造成 很 大 的 “浪费 ”， 而 让 计算 机 同时 处 理 几 项 任务 则 是 最 容易 想到 、 也 被 证 明 是 非常 有 效 的 “压榨 ”手段 。 





除了 充分 利 














是 最 重要 的 指标 之 一 ， 





之 ， 线 程 之 


服务 端 是 Java 语 
Java 语 言 和 


花费 大 部 分 时 间 去 关注 此 服务 会 同时 被 多 少 人 调 


程 。 





瑟 


它 代表 着 一 秒 内 服务 端 平均 能 响应 的 
间 频 繁 阻塞 甚至 死 锁 ， 将 会 大 大 降低 程序 的 并 发 


计算 机 处 理 器 的 能 力 外 ， 一 个 服务 端 同时 对 多 个 客户 端 提供 服务 则 是 另 一 个 更 具体 的 并 发 应 
请 求 总 数 ， 而 TPS 值 与 程序 的 并 发 能 力 又 有 非常 密切 


人 ab 
Be/J。 




















最 擅长 的 领域 之 一 ， 这 个 领域 的 应 


虚拟 机 提供 了 许多 工具 ， 把 并 发 编程 的 门槛 降低 了 不 少 。 


占 了 Java 应 























中 最 大 的 一 块 份额 由 ]， 不 过 如 何 写 好 并 发 应 















































“高 效 并 发 ”是 本 书 讲解 java 虚拟 机 的 最 后 一 部 分 ， 将 会 向 读者 介绍 虚拟 机 如 何 实现 多 线程 、 多 线程 之 间 由 于 共享 和 竞争 数据 而 导致 的 一 系列 问题 及 解决 方案 。 


四 必须 以 代码 的 总 体 规模 来 衡量 ， 服 务 端 应 用 不 能 与 JavaCard、 移 动 终端 这 些 领域 去 比 绝对 数量 。 


12.2 ”硬件 的 效率 与 一 致 性 


在 正式 讲解 Java 








的 实现 也 有 相当 大 的 参考 意义 。 


“让 计算 机 并 发 执行 若干 个 运算 任务 ”与 “更 充分 地 和 
至 少 与 内 存 的 交互 ， 如 读 取 运算 数据 、 
以 现代 计算 机 系统 都 不 得 不 加 入 一 层 读 写 速 度 尽 可 能 接近 处 理 器 运算 速度 的 高 速 缓存 (Cache) 来 作为 内 存 与 处 理 器 之 间 的 缓冲 : 将 运算 需要 使 


器 “计算 ”就 能 完成 ， 








后 再 从 缓存 同步 回 内 存 之 中 ， 这 样 处 理 器 就 无 须 等 待 缓慢 的 


基于 高 速 缓存 的 存储 交互 很 好 
一 主 内 存 (Main Memory) ， 如 图 12-1 所 示 。 当 多 个 处 理 
数据 为 准 呢 ? 为 了 解决 一 致 性 的 问题 ， 需 要 各 个 处 理 器 访问 缓存 时 都 遵循 一 些 协议 ， 在 读 





除 此 之 外 ， 为 了 使 得 处 理 器 内 部 的 运算 单元 能 尽量 被 充分 利 
顺序 执行 的 结果 是 一 致 的 ， 但 并 不 保证 程序 中 各 个 语句 计算 的 先后 顺序 与 输入 代码 中 的 顺序 一 致 ， 
保证 。 与 处 理 器 的 乱 序 执行 优化 类 似 ，Java 虚 拟 机 的 即时 编译 器 中 也 有 类 似 的 指令 导 


站 理 吕 上 


处 理 器 | 


处 理 8 中 | 人 











计算 机 处 理 器 的 效能 ”之 间 
存储 运算 结果 等 ， 就 是 很 难 











内 存 读 写 了 。 














地 解决 了 处 理 器 与 内 存 的 





速度 矛盾 ， 但 是 也 引入 了 新 的 





的 因果 关系 ， 看 起 来 顺理成章 ， 实 际 上 并 没有 想象 中 的 那么 容易 实现 ， 
消 


























是 计算 机 的 运算 速度 与 它 
一 些 手段 去 把 处 理 器 的 运算 能 


场景 。 衡 量 一 个 服务 性 能 的 高 低 好 坏 ， 每 秒 事务 处 理 数 (Transactions Per Second，TPS) 
的 关系 。 对 于 计算 量 相同 的 任务 ， 程 序 线程 并 发 协调 得 越 有 条 不 亲 ， 效 率 自然 就 会 越 高 ， 反 





程序 却 是 程序 开发 的 难点 之 一 ， 处 理 好 并 发 方面 的 问题 通常 需要 更 多 的 经 验 。 幸 好 
另外 ， 各 种 中 间 件 服务 器 、 各 类 框架 都 努力 地 蔡 程 序 员 处 理 尽 可 能 多 的 线程 并 发 细节 ， 使 得 程序 员 在 编码 时 能 更 关注 业务 逻辑 ， 而 不 是 
。 但 是 无 论语 言 、 中 间 件 和 框架 如 何 先进 ， 我 们 都 不 能 期 望 它们 能 独立 完成 并 发 处 理 的 所 有 事情 ， 了 解 并 发 的 内 幕 也 是 成 为 一 个 高 级 程序 员 不 可 缺少 的 课 


虚拟 机 并 发 相关 的 知识 之 前 ， 我 们 先 花 费 一 点 时 间 去 了 解 一 下 物理 计算 机 中 的 并 发 问题 ， 物 理 机 遇 到 的 并 发 问题 与 虚拟 机 中 的 情况 有 不 少 相 似 之 处 ， 物 理 机 对 并 发 的 处 理 方案 对 虚拟 机 


因为 所 有 的 运算 任务 都 不 可 能 只 靠 处 理 
除 的 (不 能 仅仅 靠 寄存 器 来 解决 ) 。 由 于 计算 机 的 存储 设备 与 处 理 器 的 运算 速度 之 间 有 着 几 个 数量 级 的 差距 ， 所 
到 的 数据 复制 到 缓存 中 ， 让 运算 能 快速 进行 ， 当 运算 结束 














问题 : 缓存 一 致 性 (Cache Coherence) 。 在 多 处 理 器 系统 中 ， 每 个 处 理 器 都 有 自己 的 高 速 缓存 ， 而 它们 又 共享 同 









































和 高速 缓存 


和 高速 强 三 


高 速 强 存 


图 12-1 
































12.3 ”Java 内 存 模型 


Java 庶 拟 机 规范 中 试图 定义 一 种 Java 内 存 模型 [1] (java Memory Model,JMM) 来 
前 ， 主 流程 序 语言 (如 C/C++ 等 ) 直接 使 用 物理 硬件 (或 者 说 操作 系统 的 内 存 模 型 ) ， 因 此 ， 会 由 于 不 同 平台 上 内 存 模型 的 差异 ， 























常 出 错 ， 


定义 Java 内 存 模型 并 非 一 件 容易 的 








因此 经 常 需 





针对 不 同 的 平台 来 编写 程序 。 











， 处 理 器 可 能 会 对 输入 代码 进行 乱 序 执行 (Out-Of-Order Execution) 优化 ， 处 理 器 会 在 计算 之 后 将 乱 序 执行 的 结果 重 
因此 如 果 存 在 一 个 计算 任务 依赖 另外 一 个 计算 任务 的 中 间 结 果 ， 那 么 其 顺序 性 并 不 能 靠 代码 的 先后 顺序 来 
看 排序 (Instruction Reorder) 优化 。 


器 的 运算 任务 都 涉及 同一 块 主 内 存 区 域 时 ， 将 可 能 导致 各 自 的 缓存 数据 不 一 致 的 情况 ， 如 果真 的 发 生 这 种 情况 ， 那 同步 回 到 主 内 存 时 以 谁 的 缓存 


写 时 要 根据 协议 来 进行 操作 ， 这 类 协议 有 MSI、MESI (Illinois Protocol) 、MOSI、Synapse、Firefly 及 Dragon 
Protocol， 等 等 。Java 虚 拟 机 内 存 模型 中 定义 的 内 存 访问 操作 与 硬件 的 缓存 访问 操作 是 具有 可 比 性 的 。 





Py 


人 至 


4 Ey 


说 
Bed 


处 理 器 、 高 速 缓存 、 主 内 存 间 的 交互 关系 





























有 情 ， 这 个 模型 必须 定义 得 足够 严谨 ， 才 能 让 Java 的 并 发 操作 不 会 产生 歧义 ; 但 是 ， 也 必须 定义 得 足够 宽松 ， 使 得 虚拟 机 的 实现 能 有 足够 的 自由 空间 去 利 


种 特性 (寄存 器 、 高 速 缓存 等 ) 来 获取 更 好 的 执行 速度 。 经 过 长 时 间 的 验证 和 修补 ， 在 JDK 1.5 (实现 了 JSR-133I 匀 ) 发 布 后 ，Java 的 内 存 模 型 就 已 经 成 熟 和 完善 起 来 了 。 


12.3.1” 主 内 存 与 工作 内 存 


屏蔽 掉 各 种 硬件 和 操作 系统 的 内 存 访问 差异 ， 以 实现 让 Java 程 序 在 各 种 平台 下 都 能 达到 一 致 的 并 发 效果 。 
3 致 程序 在 一 套 平台 上 并 发 完全 正常 ， 而 在 另外 一 套 平台 上 并 发 访问 却 经 














组 ， 保 证 该 结果 与 


在 此 之 


硬件 的 各 








Java 内 存 模型 的 主要 目标 是 定义 程序 中 各 个 变量 的 访问 规则 ， 即 在 虚拟 机 中 将 变量 存储 到 内 存 和 从 内 存 中 取出 变量 这 样 的 底层 细节 。 此 处 的 变量 (Variable) 与 Java 编 程 中 所 说 的 变量 略 有 区 别 ， 它 包 
， 但 是 不 包括 局 部 变量 与 方法 参数 ， 因 为 后 者 是 线程 私有 的 Bl， 不 会 被 共享 ， 自 然 就 不 存在 竞争 问题 。 为 了 获得 较 好 的 执行 效能 ，Java 内 存 模型 并 没有 限制 





括 了 实例 字段 、 静 态 字段 和 构成 数组 对 象 的 元 素 
执行 引擎 使 用 处 理 器 的 特定 寄存 器 或 绥 存 来 和 主 








Java 内 存 模型 规定 了 所 有 的 变量 都 存储 在 主 











内 存 进行 交互 ， 也 没有 限制 即时 编译 器 调整 代码 执行 顺序 这 类 权利 。 


内 存 (Main Memory) 中 (此 处 的 主 内 存 与 介绍 物理 硬件 时 的 主 内 存 名 字 一 样 ， 两 者 也 可 以 互相 类 比 ， 但 此 处 仅 是 虚拟 机 内 存 的 一 部 分 ) 。 每 条 线程 还 有 























自己 的 工作 内 存 (Working Memory， 可 与 前 


























所 讲 的 处 理 器 高 速 缓存 类 比 ) ， 线 程 的 工作 内 存 中 保存 了 被 该 线程 使 用 到 的 变量 的 主 内 存 副本 拷贝 ， 线 程 对 变量 的 所 有 操作 ( 读 取 、 赋 值 等 ) 都 必须 在 工作 


























内 存 中 进行 ， 而 不 能 直接 读 写 主 内存 中 的 变量 和 内。 不 同 的 线程 之 间 也 无 法 直接 访问 对 方 工作 内 存 中 的 变量 ， 线 程 间 变 量 值 的 传递 均 需要 通过 主 内 存 来 完成 ， 线 程 、 主 内 存 、 工 作 内 存 三 者 的 交互 关系 如 图 12- 








2 所 示 。 


Java 线 程 工作 内 存 


Java 线 程 


Java 线 程 


这 里 所 讲 的 主 内 存 、 工 作 内 存 与 本 书 第 2 章 所 讲 的 Java 内 存 区 域 中 的 Java 堆 、 栈 、 方 法 区 等 并 不 是 同一 个 层次 的 内 存 划分 。 如 果 两 者 一 定 要 勉强 对 应 起 来 ， 那 从 变量 、 主 内 存 、 工 作 内 存 的 定义 来 看 ， 主 





外 办 工作 内 存 


SP 工作 内 存 


图 12-2 ”线程 、 主 内 存 、 工 作 内 存 三 者 的 交互 关系 〈 请 























与 图 12-1 对 比 ) 








内 存 主 要 对 应 于 Java 扒 中 对 象 的 实例 数据 部 分 FJ， 而 工作 内 存 则 对 应 于 虚拟 机 栈 中 的 部 分 区 域 。 从 更 低 的 层次 来 阅 ， 主 内 存 就 是 硬件 的 内 存 ， 而 为 了 获取 更 好 的 运行 速度 ， 虚 拟 机 及 硬件 系统 可 能 会 让 工作 





内 存 优先 存储 于 寄存 器 和 高 速 缓存 中 。 


12.3.2 ”内 存 间 交 互 操作 











关于 主 内 存 与 工作 内 存 之 间 具 体 的 交互 协议 ， 即 一 个 变量 如 何 从 主 内 存 拷贝 到 工作 内 存 、 如 何 从 工作 内 存 同步 回 主 内 存 之 类 的 实现 细节 ，Java 内 存 模型 中 定义 了 以 下 八 种 操作 来 完成 [6]: 








“ lock (锁定 ) : 作用 于 主 内 存 的 变量 ， 它 把 一 个 变量 标识 为 一 条 线程 独占 的 状态 。 


:unlock (解锁 ) : 作用 于 主 内 存 的 变量 


它 把 一 个 处 于 锁定 状态 的 变量 释放 出 来 ， 释 放 后 的 变量 才 可 以 被 其 他 线程 锁定 。 


“read ( 读 取 ) : 作用 于 主 内 存 的 变量 ， 它 把 一 个 变量 的 值 从 主 内 存 传 输 到 线程 的 工作 内 存 中 ， 以 便 随 后 的 load 动 作 使 用 。 


“load ( 载 入 ) : 作用 于 工作 内 存 的 变量 ， 





它 把 read 操 作 从 主 内 存 中 得 到 的 变量 值 放 入 工作 内 存 的 变量 副本 中 。 


“Use (使 用 ) : 作用 于 工作 内 存 的 变量 ， 它 把 工作 内 存 中 一 个 变量 的 值 传递 给 执行 引擎 ， 每 当 虚 拟 机 遇 到 一 个 需要 使 用 到 变量 的 值 的 字 节 码 指令 时 将 会 执行 这 个 操作 。 


“assign (赋值 ) : 作用 于 工作 内 存 的 变量 ， 它 把 一 个 从 执行 引擎 接收 到 的 值 赋值 给 工作 内 存 的 变量 ， 每 当 上 庶 拟 机 遇 到 一 个 给 变量 赋值 的 字 节 码 指令 时 执行 这 个 操作 。 


“Store (存储 ) : 作用 于 工作 内 存 的 变量 ， 它 把 工作 内 存 中 一 个 变量 的 值 传送 到 主 内 存 中 ， 以 便 随 后 的 wtite 操 作 使 用 。 


“ write ( 写 入 ) : 作用 于 主 内 存 的 变量 ， 它 把 store 操 作 从 工作 内 存 中 得 到 的 变量 的 值 放 入 主 内 存 的 变量 中 。 





如 果 要 把 一 个 变量 从 主 内 存 复制 到 工作 内 存 ， 那 就 要 按 顺 序 地 执行 read 和 load 操 作 ， 如 果 要 把 变量 从 工作 内 存 同步 回 








主 内 存 ， 就 要 按 顺序 地 执行 store 和 write 操作 。 注 意 ，Java 内 存 模型 只 要 求 上 述 两 








个 操作 必须 按 顺 序 执行 ， 而 没有 保证 必须 是 连续 执行 。 也 就 是 说 read 与 load 之 间 、store 与 write 之 间 是 可 插入 其 他 指令 的 ， 如 对 主 内 存 中 的 变量 a、b 进 行 访问 时 ， 一 种 可 能 出 现 的 顺序 是 read a、read b、 
load b、load a。 除 此 之 外 ，Java 内 存 模型 还 规定 了 在 执行 上 述 八 种 基本 操作 时 必须 满足 如 下 规则 : 

















“ 不 允许 read 和 load、store 和 wtite 操 作 之 一 单独 出 现 ， 即 不 允许 一 个 变量 从 主 内 存 读 取 了 但 工作 内 存 不 接受 ， 或 者 从 工作 内 存 发 起 回 写 了 但 主 内 存 不 接受 的 情况 出 现 。 


“ 不 允许 一 个 线程 丢弃 它 的 最 近 的 assign 操 作 ， 即 变量 在 工作 内 存 中 改变 了 之 后 必须 把 该 变化 同步 回 主 内 存 。 


: 不 允许 一 个 线程 无 原因 地 《没有 发 生 过 任何 assign 操 作 ) 把 数据 从 线程 的 工作 内 存 同步 回 主 内 存 中 。 


' 一 个 新 的 变量 只 能 在 主 内 存 中 “诞生 ”， 不 允许 在 工作 内 存 中 直接 使 用 一 个 未 被 初始 化 〈load 或 assign) 的 变量 ， 换 和 白话 说 就 是 对 一 个 变量 实施 use 和 stote 操 作 之 前 ， 必 须 先 执行 过 了 assign 和 load 操 作 。 


“ 一 个 变量 在 同一 个 时 刻 只 允许 一 条 线程 对 其 进行 lock 操 作 ， 但 lock 操 作 可 以 被 同一 条 线程 重复 执行 多 次 ， 多 次 执行 lock 后 ， 只 有 执行 相同 次 数 的 unlock 操 作 ， 变 量 才 会 被 解锁 。 


“ 如 果 对 一 个 变量 执行 lock 操 作 ， 将 会 清空 工作 内 存 中 此 变量 的 值 ， 在 执行 引擎 使 用 这 个 变量 前 ， 需 要 重新 执行 load 或 assign 操 作 初 始 化 变量 的 值 。 


“ 如 果 一 个 变量 事先 没有 被 lock 操 作 锁 定 ， 则 不 允许 对 它 执 行 unlock 操 作 ; 也 不 允许 去 unlock 一 个 被 其 他 线程 锁定 住 的 变量 。 


“ 对 一 个 变量 执行 unlock 操 作 之 前 ， 必 须 先 把 此 变量 同步 回 主 内 存 中 (执行 sotre 和 wtite 操 作 ) 。 


12.3.3 ”对 于 volatile 型 变量 的 特殊 规则 



































关键 字 volatile 可 以 说 是 Java 虚 拟 机 提供 的 最 轻 量 级 的 同步 机 制 ， 但 是 它 并 不 容易 被 正确 地 、 完 整地 理解 ， 以 至 于 许多 程序 员 都 习惯 不 去 使 用 它 ， 遇 到 需要 处 理 多 线程 数据 竞争 的 问题 时 一 律 使 
synchronized 来 进行 同步 。 了解 volatile 变 量 的 语义 对 后 面 了 解 多 线程 操作 的 其 他 特性 有 很 重要 的 意义 ， 在 本 节 中 我 们 将 多 花费 一 些 时 间 去 弄 清楚 volatile 的 语义 到 底 是 什么 ? 




























































































Java 内 存 模型 对 volatile 专 门 定义 了 一 些 特殊 的 访问 规则 ， 在 介绍 这 些 比较 扶 口 的 规则 定义 之 前 ， 笔 者 先 用 不 那么 正式 ， 但 通俗 易 懂 一 些 的 语言 来 介绍 一 下 这 个 关键 字 的 作用 。 













































































当 一 个 变量 被 定义 成 volatile 之 后 ， 它 将 具备 两 种 特性 ， 第 一 是 保证 此 变量 对 所 有 线程 的 可 见 性 ， 这 里 的 “可 见 性 ”是 指 当 一 条 线程 修改 了 这 个 变量 的 值 ， 新 值 对 于 其 他 线程 来 说 是 可 以 立即 得 知 的。 而 
普通 变量 不 能 做 到 这 一 点 ， 变 量 值 在 线程 间 传 递 均 需 要 通过 主 内 存 来 完成 ， 如 : 线程 A 修 改 一 个 普通 变量 的 值 ， 然 后 向 主 内 存 进行 回 写 ， 另 外 一 条 线程 B 在 线程 A 回 写 完成 了 之 后 再 从 主 内 存 进行 读 取 操作 ， 
新 变量 的 值 才 会 对 线程 B 可 见 。 
















































































关于 volatile 变 量 的 可 见 性 ， 经 常会 被 开发 人 员 误 解 ， 认 为 以 下 描述 成 立 : “Volatile 变量 对 所 有 线程 是 立即 可 见 的 ， 对 volatile 变 量 所 有 的 写 操作 都 能 立刻 反应 到 其 他 线程 之 中 ， 换 名 话说，volatile 变 量 
在 各 个 线程 中 是 一 致 的 ， 所 以 基于 volatile 变 量 的 运算 在 并 发 下 是 安全 的 ”。 这 句 话 的 论据 部 分 并 没有 错 ， 但 是 其 论据 并 不 能 得 出 “基于 volatile 变 量 的 运算 在 并 发 下 是 安全 的 ”这 个 结论 。volatile 变 量 在 各 
个 线程 的 工作 内 存 中 不 存在 一 致 性 问题 (在 各 个 线程 的 工作 内 存 中 volatile 变 量 也 可 以 存在 不 一 致 的 情况 ， 但 由 于 每 次 使 用 之 前 都 要 先 刷 新 ， 执 行 引擎 看 不 到 不 一 致 的 情况 ， 因 此 可 以 认为 不 存在 一 致 性 问 
题 ) ， 但 是 Java 里 面 的 运算 并 非 原子 操作 ， 导 致 volatile 变 量 的 运算 在 并 发 下 一 样 是 不 安全 的 ， 我 们 可 以 通过 一 段 简单 的 演示 来 说 明 原 因 ， 请 看 代码 清单 12-1 中 演示 的 例子 。 

























































































代码 清单 12-1 volatile 的 运算 





/a 
* volatile 变 量 自 增 运 算 测 试 
x 


* @author zzm 
I 
public class VolatileTest { 
public static volatile int race = 0; 
public static void increase() { 
TaCe+ 二 7 
} 
private static final int THREADS COUNT = 20; 
public static void main(String[] args) { 
Thread[] threads = new Thread [THREADS COUNT]; 
for (int i = 0; i < THREADS COUNT; i++) { 
threads[i] = new Thread (new Runnable() { 
QOverride 
public void run() { 
for (int i = 0; i < 10000; i++) { 
increase(); 
} 
} 


DD); 
threads[il] .start (); 


} 

// 等 待 所 有 累加 线程 都 结束 

while (Thread.activeCount() > 1) 
Thread.yield(); 

System.out .println (race); 





























这 段 代 码 发 起 了 20 个 线程 ， 每 个 线程 对 race 变 量 进行 10000 次 自 增 操作 ， 如 果 这 段 代 码 能 够 正确 并 发 的 话 ， 最 后 输出 的 结果 应 该 是 200000。 读 者 运行 完 这 段 代码 之 后 ， 并 不 会 获得 期 望 的 结果 ， 而 且 会 
发 现 每 次 运行 程序 ， 输 出 的 结果 都 不 一 样 ， 都 是 一 个 小 于 200000 的 数字 ， 这 是 为 什么 呢 ? 























问题 就 出 现在 自 增 运算 “race++” 之 中 ， 我 们 用 Javap 反 编译 这 段 代 码 后 会 得 到 代码 清单 12-2， 发 现 只 有 一 行 代码 的 increase() 方 法 在 Class 文 件 中 是 由 4 条 字 节 码 指令 构成 的 〈return 指 令 不 是 由 
race++ 产 生 的 ， 这 条 指令 可 以 不 算 ) ， 从 字 节 码 层面 上 很 容易 就 分 析出 并 发 失败 的 原因 了 : 当 getstatic 指 令 把 race 的 值 取 到 操作 栈 顶 时 ，volatile 关 键 字 保证 了 race 的 值 在 此 时 是 正确 的 ， 但 是 在 执行 
iconst 1、iadd 这 些 指令 的 时 候 ， 其 他 线程 可 能 已 经 把 race 的 值 加 大 了 ， 而 在 操作 栈 顶 的 值 就 变 成 了 过 期 的 数据 ， 所 以 putstatic 指 令 执行 后 就 可 能 把 较 小 的 race 值 同步 回 主 内 存 之 中 。 







































































代码 清单 12-2 VolatileTest 的 字 节 码 





public static void increase () 7 
Code : 


Stack=2, Locals=0, Args size=0 

0: getstatic #13; //Field race:I 
人 iconst 1 

4: iadd 

5: putstatic #13; //Field race:I 
8: return 

LineNumberTable: 

line 14: 0 

line 15: 8 




















实事 求 是 地 说 ， 笔 者 在 此 使 用 字 节 码 来 分 析 并 发 问题 ， 仍 然 是 不 严谨 的 ， 因 为 即使 编译 出 来 只 有 一 条 字 节 码 指令 ， 也 并 不 意味 着 执行 这 条 指令 就 是 一 个 原子 操作 。 一 条 字 节 码 指 令 在 解释 执行 时 ， 解 释 
器 将 要 运行 许多 行 代 码 才能 实现 它 的 语义 ， 如 果 是 编译 执行 ， 一 条 字 节 码 指令 也 可 能 转化 成 若干 条 本 地 机 器 码 指令 ， 此 处 使 用 -XX: +PrintAssembly 参 数 输出 反 汇编 来 分 析 会 更 加 严谨 一 些 ,但 是 考虑 到 读 
者 阅读 的 方便 ， 并 且 字 节 码 已 经 能 说 明 问题 ， 所 以 此 处 使 用 字 节 码 来 分 析 。 










































































由 于 volatile 变 量 只 能 保证 可 见 性 ， 在 不 符合 以 下 两 条 规则 的 运算 场景 中 ， 我 们 仍然 要 通过 加 锁 (使 用 synchronized 或 java.util.concurrent 中 的 原子 类 ) 来 保证 原子 性 。 

















“ 运算 结果 并 不 依赖 变量 的 当前 值 ， 或 者 能 够 确保 只 有 单一 的 线程 修改 变量 的 值 。 


“ 变量 不 需要 与 其 他 的 状态 变量 共同 参与 不 变 约束 。 























而 在 像 如 下 的 代码 清单 12-3 所 示 的 这 类 场景 就 很 适合 使 用 volatile 变 量 来 控制 并 发 ， 当 shutdown0 方 法 被 调用 时 ， 能 保证 所 有 线程 中 执行 的 doWork() 方 法 都 立即 停 下 来 。 



































代码 清单 12-3 ”volatile 的 使 用 场景 














volatile boolean shutdownRequested; 
public void shutdown() { 
shutdownRequested = true; 
} 
public void doWork() { 
while (!shutdownRequested) { 
// do stuff 
} 



































使 用 volatile 变 量 的 第 二 个 语义 是 禁止 指令 重 排序 优化 ， 普 通 的 变量 仅仅 会 保证 在 该 方法 的 执行 过 程 中 所 有 依赖 赋值 结果 的 地 方 都 能 获取 到 正确 的 结果 ， 而 不 能 保证 变量 赋值 操作 的 顺序 与 程序 代码 中 的 
执行 顺序 一 致 。 因 为 在 一 个 线程 的 方法 执行 过 程 中 无 法 感知 到 这 点 ， 这 也 就 是 Java 内 存 模型 中 描述 的 所 谓 的 “线程 内 表现 为 串 行 的 语义 ” (Within-Thread As-If-Serial Semantics) 。 















































上 面 的 描述 仍然 比较 扼 口 难 明 ， 我 们 还 是 继续 通过 一 个 例子 来 看 看 为 何 指令 重 排序 会 干扰 程序 的 并 发 执行 吧 ， 演 示 程 序 如 代码 清单 12-4 所 示 。 


























代码 清单 12-4 ”指令 重 排序 

















Map configOptions; 
char[] configText; 
// 此 变量 必须 定义 为 volatile 
volatile boolean initialized = false; 
// 假设 以 下 代码 了 ER 中 执行 
// 模拟 读 取 配 置 人 当 读 取 完 成 后 
// 将 initialized 设 置 为 true 来 通知 其 他 线程 配置 可 用 
configOptions = new HashMap () 7 
configText = readConfigrile (fileName) 7 
ProcessConfigoptions (configText, configOptions); 
initialized = true; 
// 假设 以 下 代码 在 线程 B 中 执行 
// 等 待 initialized 为 true， 代 表 线 程 R 已 经 把 配置 信息 初始 化 完成 
while (!initialized) { 

sleep(); 


} 
// 使 用 线程 A 中 初始 化 好 的 配置 信息 
doSomethingWithConfig(); 


























代码 清单 12-4 中 的 程序 是 一 段 伪 代码 ， 其 中 描述 的 场景 十 分 常见 ， 只 是 我 们 在 处 理 配置 文件 时 一 般 不 会 出 现 并 发 而 已 。 如 果 定 义 initialized 变 量 时 没有 使 用 volatile 修 饰 ， 就 可 能 会 由 于 指令 重 排序 的 优 
化 ， 导 致 位 于 线程 A 中 最 后 一 句 的 代码 “initialized=true” 被 提前 执行 ， 这 样 在 线程 B 中 使 用 配置 信息 的 代码 就 可 能 出 现 错误 ， 而 volatile 关 键 字 则 可 以 避免 此 类 情况 的 发 生 [/]。 




























































































解决 了 volatile 的 语义 问题 ， 再 来 看 看 在 众多 保障 并 发 安全 的 工具 中 选用 volatile 的 意义 一 一 它 能 让 我 们 的 代码 比 使 用 其 他 的 同步 工具 更 快 吗 ? 确实 在 某 些 情况 下 ，volatile 同 步 机 制 的 性 能 要 优 于 锁 (使 
synchronized 关 键 字 或 java.util.concurrentb 包 里 面 的 锁 ) ， 但 是 由 于 虚拟 机 对 锁 实行 的 许多 消除 和 优化 ， 使 得 我 们 很 难 量化 地 说 volatile 就 会 比 synchronized 快 上 多 少 。 如 果 让 volatile 自 己 与 自己 比 
较 ， 则 可 以 确定 一 个 原则 : volatile 变 量 读 操作 的 性 能 消耗 与 普通 变量 几乎 没有 什么 差别 ， 但 是 写 操作 则 可 能 会 慢 上 一 些 ， 因 为 它 需 要 在 本 地 代码 中 插入 许多 内 存 屏障 (Memory Barrier 或 Memory 
Fence) 指令 图 来 保证 处 理 器 不 发 生 乱 序 执行 。 不 过 即便 如 此 ， 大 多 数 场景 下 volatile 的 总 开销 仍然 要 比 锁 来 得 低 ， 我 们 在 volatile 与 锁 中 选择 的 唯一 判断 依据 仅仅 是 volatile 的 语义 能 否 满足 使 用 场景 的 需 
求 。 












































































































































本 节 的 最 后 ， 我 们 再 回头 来 看 看 Java 内 存 模型 中 对 volatile 变 量 定义 的 特殊 规则 。 假 定 T 表 示 一 个 线程 ，V 和 W 分 别 表 示 两 个 volatile 型 变量 ， 那 么 在 进行 read、load、use、assign、store 和 write 操作 时 
需要 满足 如 下 的 规则 : 


: 只 有 当 线 程 T 对 变量 V 执 行 的 前 一 个 动作 是 load 的 时 候 ， 线 程 T 才 能 对 变量 V 执 行 use 动 作 ; 并 且 ， 只 有 当 线 程 T 对 变量 V 执 行 的 后 一 个 动作 是 use 的 时 候 ， 线 程 T 才 能 对 变量 V 执 行 load 动 作 。 线 程 T 对 变量 V 
的 use 动 作 可 以 认为 是 与 线程 T 对 变量 V 的 load 和 tread 动作 相关 联 的 ， 必 须 一 起 连续 出 现 。 (这 条 规则 要 求 在 工作 内 存 中 ， 每 次 使 用 V 前 都 必须 先 从 主 内 存 刷新 最 新 的 值 ， 用 于 保证 能 看 见 其 他 线程 对 变量 V 所 做 
的 修改 后 的 值 ) 。 


“ 只 有 当 线程 T 对 变量 V 执 行 的 前 一 个 动作 是 assign 的 时 候 ， 线 程 T 才 能 对 变量 V 执 行 store 动 作 ; 并 且 ， 只 有 当 线 程 T 对 变量 V 执 行 的 后 一 个 动作 是 store 的 时 候 ， 线 程 T 才 能 对 变量 V 执 行 assign 动 作 。 线 程 T 对 
变量 V 的 assign 动 作 可 以 认为 是 与 线程 T 对 变量 V 的 store 和 wtite 动 作 相关 联 的 ， 必 须 一 起 连续 出 现 ( 这 条 规则 要 求 在 工作 内 存 中 ， 每 次 修 政 V 后 都 必须 立刻 同步 回 主 内 存 中 ， 用 于 保证 其 他 线程 可 以 看 到 自己 对 
变量 V 所 做 的 修改 ) 。 


“ 假定 动作 A 是 线程 T 对 变量 V 实 施 的 use 或 assign 动 作 ， 假 定 动作 F 是 与 动作 A 相关 联 的 load 或 store 动 作 ， 假 定 动作 P 是 与 动作 F 相 应 的 对 变量 V 的 read 或 write 动 作 ; 类 似 地 ， 假 定 动作 B 是 线程 [对 变量 扩 实 施 
的 use 或 assign 动 作 ， 假 定 动作 G 是 与 动作 B 相 关联 的 load 或 store 动 作 ， 假 定 动 作 Q 是 与 动作 G 相 应 的 对 变量 W 的 read 或 write 动 作 。 如 果 A 先 于 B， 那 么 P 先 于 Q (这 条 规则 要 求 volatile 修 饰 的 变量 不 会 被 指令 重 排序 
优化 ， 保 证 代码 的 执行 顺序 与 程序 的 顺序 相同 ) 。 


12.3.4 ”对 于 long 和 double 型 变量 的 特殊 规则 























Java 内 存 模型 要 求 lock、unlock、read、load、assign、use、store 和 write 这 八 个 操作 都 具有 原子 性 ， 但 是 对 于 64 位 的 数据 类 型 (long 和 double) ， 在 模型 中 特别 定义 了 一 条 宽松 的 规定 : 允许 虚拟 
机 将 没有 被 volatile 修 饰 的 64 位 数据 的 读 写 操作 划分 为 两 次 32 位 的 操作 来 进行 ， 即 允许 虚拟 机 实现 选择 可 以 不 保证 64 位 数据 类 型 的 load、store、read 和 write 这 四 个 操作 的 原子 性 ， 这 点 就 是 所 谓 的 long 和 
double 的 非 原子 性 协定 (Nonatomic Treatment of double and long Variables) 。 









































如 果 有 多 个 进程 共享 一 个 并 未 声明 为 volatile 的 long 或 double 类 型 的 变量 ， 并 且 同 时 对 它们 进行 读 取 和 修改 操作 ， 那 么 某 些 线程 可 能 会 读 取 到 一 个 既 非 原 值 ， 也 不 是 其 他 线程 修改 值 的 代表 了 “ 半 个 变 
量 ” 的 数值 。 




















不 过 这 种 读 取 到 “ 半 个 变量 ”的 情况 非常 军 见 ， 因 为 Java 内 存 模型 虽然 允许 虚拟 机 不 把 long 和 double 变 量 的 读 写实 现成 原子 操作 ， 但 允许 虚拟 机 选择 把 这 些 操作 实现 为 具有 原子 性 的 操作 ， 而 且 还 “ 强 
烈 建 议 ”虚拟 机 这 样 实现 。 在 实际 开发 中 ， 目 前 各 种 平台 下 的 商用 虚拟 机 几乎 都 选择 把 64 位 数据 的 读 写 操作 作为 原子 操作 来 对 待 ， 因 此 我 们 在 编写 代码 时 一 般 不 需要 将 用 到 的 long 和 double 变 量 专门 声明 为 


volatile。 







































































12.3.5 ”原子 性 、 可 见 性 与 有 序 性 


介绍 完 Java 内 存 模型 的 相关 操作 和 规则 ， 我 们 再 整体 回顾 一 下 这 个 模型 的 特征 。Java 内 存 模型 是 围绕 着 在 并 发 过 程 中 如 何 处 理 原子 性 、 可 见 性 和 有 序 性 这 三 个 特征 来 建立 的 ， 我 们 逐个 来 看 一 下 哪些 操 
作 实 现 了 这 三 个 特性 。 


























原子 性 (Atomicity) : 由 Java 内 存 模型 来 直接 保证 的 原子 性 变量 操作 包括 read、load、assign、use、store 和 write 这 六 个 ， 我 们 大 致 可 以 认为 基本 数据 类 型 的 访问 读 写 是 具备 原子 性 的 (long 和 
double 的 非 原子 性 协定 例外 ， 笔 者 的 观点 是 知道 这 件 事情 就 可 以 了 ， 无 须 太 过 在 意 这 些 几 乎 不 会 发 生 的 例外 情况 ) 。 






























































如 果 应 用 场景 需要 一 个 更 大 范围 的 原子 性 保证 (经 常会 遇 到 ) ，Java 内 存 模型 还 提供 了 lock 和 unlock 操 作 来 满足 这 种 需求 ， 尽 管 虚 拟 机 未 把 lock 和 unlock 操 作 直接 开放 给 用 户 使 用 ， 但 是 却 提供 了 更 高 
层次 的 字 节 码 指令 monitorenter 和 monitorexit 来 隐 式 地 使 用 这 两 个 操作 ， 这 两 个 字 节 码 指令 反映 到 Java 代 码 中 就 是 同步 块 一 一 synchronized 关 键 字 ， 因 此 在 synchronized 块 之 间 的 操作 也 具备 原子 性 。 

















































































































可 见 性 (Visibility) : 可 见 性 就 是 指 当 一 个 线程 修改 了 共享 变量 的 值 ， 其 他 线程 能 够 立即 得 知 这 个 修改 。 上 文 在 讲解 volatile 变 量 的 时 候 我 们 已 详细 讨论 过 这 一 点 。Java 内 存 模 型 是 通过 在 变量 修改 后 将 
新 值 同步 回 主 内 存 ， 在 变量 读 取 前 从 主 内 存 刷新 变量 值 这 种 依赖 主 内 存 作为 传递 媒介 的 方式 来 实现 可 见 性 的 ， 无 论 是 普通 变量 还 是 volatile 变 量 都 是 如 此 ， 普 通 变量 与 volatile 变 量 的 区 别 是 volatile 的 特殊 规 
则 保证 了 新 值 能 立即 同步 到 主 内 存 ， 以 及 每 次 使 用 前 立即 从 主 内 存 刷 新 。 因 此 我 们 可 以 说 volatile 保 证 了 多 线程 操作 时 变量 的 可 见 性 ， 而 普通 变量 则 不 能 保证 这 一 点 。 






















































































除了 volatile 之 外 ，Java 还 有 两 个 关键 字 能 实现 可 见 性 ， 它 们 是 synchronized 和 final。 同 步 块 的 可 见 性 是 由 “对 一 个 变量 执行 unlock 操 作 之 前 ， 必 须 先 把 此 变量 同步 回 主 内 存 中 (执行 sotre 和 write 操 
作 ) ”这 条 规则 获得 的 ， 而 final 关 键 字 的 可 见 性 是 指 : 被 final 修 饰 的 字段 在 构造 器 中 一 旦 被 初始 化 完成 ， 并 且 构 造 器 没有 把 “this” 的 引用 传递 出 去 (this 引 用 逃逸 是 一 件 很 危险 的 事情 ， 其 他 线程 有 可 能 和 
过 这 个 引用 访问 到 “初始 化 了 一 半 ” 的 对 象 ) ， 那 么 在 其 他 线程 中 就 能 看 见 final 字 段 的 值 。 如 代码 清单 12-5 所 示 ， 变 量 与 j 都 具备 可 见 性 ， 它 们 无 须 同步 就 能 被 其 他 线程 正确 地 访问 。 

























































































代码 清单 12-5 ”final 与 可 见 性 





public static final int i; 
public final int j; 
static { 

i = 0; 
// do something 
bs 


// 也 可 以 选择 在 构造 函数 中 初始 化 


j = 0; 
// do something 


有 序 性 (Ordering) : Java 内 存 模型 的 有 序 性 在 前 面 讲解 volatile 时 也 详细 
观察 男 一 个 线程 ， 所 有 的 操作 都 是 无 序 的 。 前 


Java 语 言 提 供 了 volatile 和 synchronized 两 个 关键 字 来 保证 线程 之 间 操作 | 























句 是 指 “线程 内 表现 为 串 行 的 语义 ” 

















程 对 其 进行 lock 操 作 ” 这 条 规则 获得 的 ， 这 个 规则 决定 了 持 有 同一 个 锁 的 两 个 同步 块 只 能 串 行 地 进入 。 


介绍 完 并 发 的 三 种 
synchronized 来 完成 。synchronized 的 “万 能 ”也 间接 造就 了 它 被 程序 员 滥 F 





12.3.6 ”先行 发 生 原 则 


如 果 Java 内 存 模型 中 所 有 的 有 序 性 都 只 靠 volatile 和 synchronized 来 完成 ， 那 么 有 一 些 操作 将 会 变 得 很 喝 嗪 ， 但 是 我 们 在 编写 Java 并 发 代码 的 时 候 并 没有 感觉 到 这 一 点 ， 这 是 
(happens-before) 的 原则 。 这 个 原则 非常 


行 发 生 ” 
在 冲突 的 所 有 问题 。 


现在 就 来 看 看 “先行 发 生 ” 原 则 指 的 是 什么 。 先 行 发 生 是 Java 内 存 模型 中 定义 的 两 项 操作 之 间 的 偏 序 关 系 ， 如 果 说 操作 A 先行 发 生 于 操作 B， 
“影响 ”包括 修改 了 内 存 中 共享 变量 的 值 、 发 送 了 消息 、 调 


观察 到 ， 

















的 局 本 





， 越 “万能” 






































要 ， 它 是 判断 数据 是 否 存在 竞 

















排序 ”现象 和 “工作 内 存 与 3 


要 特性 ， 读 者 有 没有 发 现 synchronized 关 键 字 在 需要 这 三 种 特性 的 时 候 都 可 以 作为 其 中 一 种 的 解决 方案 ? 看 起 来 很 “万 能 ” 吧 ? 的 确 ， 大 部 分 的 并 发 控制 操作 都 能 使 
的 并 发 控制 ， 通 常会 伴随 着 越 大 的 性 能 影响 ， 这 点 我 们 将 在 下 一 章 再 谈 。 











因 











田地 讨论 过 了 ，Java 程 序 中 天 然 的 有 序 性 可 以 总 结 为 一 句 话 : 如 果 在 本 线程 内 观察 ， 所 有 的 操作 都 是 有 序 的 ; 如 果 在 一 个 线程 中 


(Within-Thread As-If-Serial Semantics) ， 后 半 句 是 指 “ 指 令 奸 内 存 同 步 延 迟 ” 现 象 。 


的 有 序 性 ，volatile 关 键 字 本 身 就 包含 了 禁止 指令 重 排序 的 语义 ， 而 synchronized 则 是 由 “一 个 变量 在 同一 个 时 刻 只 允许 一 条 线 




















为 Java 语 言 中 有 一 个 “ 先 
， 线 程 是 否 安全 的 主要 依据 ， 依 赖 这 个 原则 ， 我 们 可 以 通过 几 条 规则 一 揽 子 解决 并 发 环境 下 两 个 操作 之 间 是 否 可 能 存 


实 就 是 说 在 发 生 操作 B 之 前 ， 操 作 A 产 生 的 影响 能 被 操作 B 

















了 方法 等 。 














代码 清单 12-6 ”先行 发 生 原则 的 示例 1 





// 以 下 操作 在 线程 A 中 执行 





假设 线程 A 中 的 操作 “i=1” 先 行 发 生 于 


没有 先行 发 生 关系 ， 那 的 值 会 是 多 少 呢 ? 答案 是 不 确定 ! 1 和 2 都 有 可 能 ， 因 为 线程 C 对 变量 i 的 影响 可 能 会 被 线程 B 观 察 到 ， 也 可 能 不 会 ， 这 时 候 线程 B 就 存在 读 取 到 过 期 数据 的 风险 ， 不 


下 面 是 Java 内 存 模型 下 一 些 “ 天 然 的 ”先行 发 生 关系 ， 这 些 先行 发 生 关系 无 须 任 何 同步 器 协助 就 已 经 存在 ， 可 以 在 编码 中 直接 使 





1; 

// 以 下 操作 在 线程 B 中 执行 
17 

// 吕 下 识 作 在 线程 中 次 得 








线程 B 的 操作 “j=i” ， 那 我 们 就 可 以 确定 在 线程 B 的 操作 执行 后 ， 
可 以 被 观察 到 ; 二 是 线程 C 登 场 之 前 ， 线 程 A 操 作 结束 之 后 没有 其 他 线程 会 修改 变量 i 的 值 。 现 在 再 来 考虑 线程 C， 我 们 依然 保持 线程 A 





变量 的 值 一 定 是 等 于 1， 得 





的 话 ， 它 们 就 没有 顺序 性 保障 ， 虚 拟 机 可 以 对 它们 进行 随意 地 重 排序 。 


“ 程序 次 序 规则 
环 等 结构 。 


管 程 锁定 规则 


. volatile 变 量规 则 (Volatile Variable Rule) 


“ 线程 启动 规则 


“ 线程 终止 规则 






































这 句 话 不 难 理解 ， 但 它 意味 着 什么 呢 ? 我 们 可 以 举 个 例子 来 说 明 一 下 ， 如 代码 清和 








和 E12-6 中 所 示 的 这 三 句 伪 代 码 : 





出 这 个 结论 的 依据 有 两 个 ， 一 是 根据 先行 发 生 原则 ， 
B 之 间 的 先行 发 生 关系 ， 而 Ci 


“=1 的 结果 


现在 线程 A 和 B 的 操作 之 间 ， 但 是 与 B 




















备 多 线程 安全 性 。 





。 如 果 两 个 操作 之 间 的 关系 不 在 此 列 ， 并 且 无 法 从 下 列 规则 推导 出 来 


(Program Order Rule) : 在 一 个 线程 内 ， 按 照 程序 代码 顺序 ， 书 写 在 前 面 的 操作 先行 发 生 于 书写 在 后 面 的 操作 。 准 确 地 说 应 该 是 控制 流 顺序 而 不 是 程序 代码 顺序 ， 因 为 要 考虑 分 支 、 循 


(Monitor Lock Rule) : 一 个 unlock 操 作 先 行 发 生 于 后 面 对 同 一 个 锁 的 lock 操 作 。 这 里 必须 强调 的 是 同一 个 锁 ， 而 “后 面 ”是 指 时 间 上 的 先后 顺序 。 


(Thread Start Rule) : 


(Thread Termination Rule) : 


Thread 对 象 的 start0) 方 法 先行 发 生 于 此 线程 的 每 一 个 动作 。 


: 对 一 个 volatile 变 量 的 写 操作 先行 发 生 于 后 面 对 这 个 变量 的 读 操作 ， 这 里 的 “后 面 ”同样 是 指 时 间 上 的 先后 顺序 。 


线程 中 的 所 有 操作 都 先行 发 生 于 对 此 线程 的 终止 检测 ， 我 们 可 以 通过 Thread.join0 方 法 结束 、Thread.isAlive0 的 返回 值 等 手段 检测 到 线程 已 经 终止 执行 。 


线程 中 断 规则 (Thread Interruption Rule) : 对 线程 interrupt0 方 法 的 调用 先行 发 生 于 被 中 断 线程 的 代码 检测 到 中 断 事件 的 发 生 ， 可 以 通过 Thread.interrupted0 方 法 检测 到 是 否 有 中 断 发 生 。 


对 象 终结 规则 





(Finalizer Rule) : 


一 个 对 象 的 初始 化 完成 (构造 函数 执行 结 


) 先行 发 生 于 它 的 finalize0 方 法 的 开始 。 


: 传递 性 (Transitivity) : 如 果 操 作 A 先 行 发 生 于 操作 B， 操 作 B 先 行 发 生 于 操作 C， 那 就 可 以 得 出 操作 A 先行 发 生 于 操作 C 的 结论 。 


Java 语 言 无 须 任何 同步 手段 保障 就 能 成 立 的 先行 发 生 规则 就 只 有 上 面 这 些 了 ， 笔 者 演示 一 下 如 何 使 


























还 可 以 从 下 面 这 个 例子 中 感受 一 下 “时 间 上 的 先后 顺序 ”与 “先行 发 生 ” 之 间 有 什么 不 同 。 演 示例 子 如 代码 清单 12-7 所 示 。 





代码 清单 12-7 ”先行 发 生 原则 的 示例 2 


private int value = 0; 
pubilc void setValue (int value){ 


this.value = value; 


} 
public int getValue(){ 
return value; 


} 





这 些 规则 去 判定 操作 间 是 否 具备 顺序 性 ， 对 于 读 写 共享 变量 的 操作 来 说 ， 就 是 线程 是 否 安 全 ， 读 者 

















代码 清单 12-7 中 显示 的 是 一 组 





到 的 返回 值 是 什么 ? 


我 们 依次 分 析 一 下 先行 发 生 原则 











程 锁定 规则 不 适 





则 ， 所 以 最 后 一 条 传递 性 也 无 从 谈 起 ， 因 


那 怎么 修复 这 个 问题 呢 ? 我们 至 少 有 两 种 比较 简 和 





中 的 


普通 不 过 的 getter/setter 方 法 ， 假 设 存在 线程 A 和 B， 线 程 A 先 (时间 上 的 先后 ) 调 


各 项 规则 ， 由 于 两 个 方法 分 别 由 线程 A 和 B 调 用 ， 不 在 一 个 线程 中 ， 所 以 程序 次 序 规则 在 这 里 不 适用 ;， 由 于 没有 同步 块 ， 自 然 就 不 会 发 生 lock 和 unloc 


; 由 于 value 变 量 没有 被 volatile 关 键 字 修饰 ， 所 以 volatile 变 量规 则 不 适用 ; 后 面 的 线程 启动 、 终 止 、 中 断 规则 和 对 象 终结 规则 也 和 这 里 完全 扯 不 上 关系 。 因 








setter 方 法 对 value 的 修改 不 依赖 value 的 


[al 





过 上 面 的 例子 ,我 们 可 以 得 出 结论 : 


此 我 们 可 以 判定 尽管 线程 A 在 操作 时 间 上 先 于 线程 8， 但 是 无 法 确定 B 中 “getValue()” 方 法 的 返回 结果 ， 





的 方案 可 以 选择 : 要 么 把 getter/setter 方 法 都 定义 为 synchronized 方 法 ， 这 样 就 可 以 套 























了 "setVa 
























































ue(1)”， 然 后 线程 B 调 


换 名 话说， 这 里 夯 

















为 没有 一 个 适 


了 同一 个 对 象 的 “getValue0”， 那 么 线程 B 收 


操作 ， 所 以 管 
的 先行 发 生 规 



























































原 值 ， 满 足 了 volatile 关 键 字 使 F 





憾 ， 这 个 推论 也 是 不 成 立 的 ， 一 个 典型 的 


代码 清单 12-8 ”先行 发 生 原则 示例 3 





例子 就 是 多 次 提 到 的 “指令 和 


一 个 操作 “时 间 上 的 先 发 生 ” 

















volatile 变 量规 则 来 实现 先行 发 生 关系 。 





场景 ， 这 样 就 可 以 套 F 














排序 。 ， 演示 例子 如 代码 清单 12-8 所 示 。 


的 操作 不 是 线程 安全 的 。 


管 程 锁定 规则 ; 要么 把 value 定 义 为 volatile 变 量 ， 由 于 


不 代表 这 个 操作 会 是 “先行 发 生 ”， 那 如 果 一 个 操作 “先行 发 生 ” 是 否 就 能 推导 出 这 个 操作 必定 是 “时 间 上 的 先 发 生 ” 呢 ? 很 遗 


// 以 下 操作 在 同一 个 线程 中 执行 
i = 17 


int i = 
int j = 2; 


代码 清单 12-8 的 两 条 复制 语句 在 同一 个 线程 之 中 ， 根 据 程序 次 序 规则 ，“int i=1” 的 操作 先行 发 生 于 “int j=2”,， 但 是 “int j=2” 的 代码 完全 可 能 先 被 处 理 器 执行 ， 这 并 不 影响 先行 发 生 原则 的 正确 
性 ， 因 为 我 们 在 这 条 线程 之 中 没有 办 法 感知 到 这 点 。 








上 面 两 个 例子 综合 起 来 证 明了 一 个 结论 : 时 间 上 的 先后 顺序 与 先行 发 生 原则 之 间 基 本 没有 太 大 的 关系 ， 所 以 我 们 衡量 并 发 安全 问题 的 时 候 不 要 受到 时 间 顺 序 的 干扰 ， 一 切 必须 以 先行 发 生 原则 为 准 。 











1] 本 书 中 的 Java 内 存 模 型 都 特 指 目前 正在 使 用 的 ， 在 JDK 1.2 之 后 建立 起 来 并 在 JDK 1.5 中 完备 过 的 内 存 模 型 。 

2] JSR-133 : Java Memory Model and Thread Specification Revision (Java 内 存 模型 和 线程 规范 修订 ) 。 

3] 此 处 请 读者 注意 区 分 概念 : 如 果 局 部 变量 是 一 个 reference 类 型 ， 它 引用 的 对 象 在 Java 堆 中 可 被 各 个 线程 共享 ， 但 是 reference 本 身 在 Java 栈 的 局 部 变量 表 中 ， 它 是 线程 私有 的 。 

引 根据 Java 虚拟 机 规范 的 规定 ，volatile 变量 依然 有 工作 内 存 的 拷贝 ,但 是 由 于 它 特 殊 的 操作 顺序 性 规定 (后 文 会 讲 到 ) ， 所 以 看 起 来 如 同 直接 在 主 内 存 中 读 写 访问 一 般 ， 因 此 这 里 的 描述 对 于 volatile 也 没有 
例外 。 

5] 除了 实例 数据 ，Java 堆 还 保存 了 对 象 的 其 他 信息 ， 对 于 HotSpot 虚拟 机 来 讲 ， 有 Mark Word (存储 对 象 哈 希 码 、GC 标志 、GC 年 龄 、 同 步 锁 等 信息 ) 、Klass Point (指向 存储 类 型 元 数据 的 指针 ) 及 一 些 用 
于 字 节 对 齐 补 白 的 填充 数据 〈 如 果实 例 数据 刚好 满足 8 字 节 对 齐 的 话 ， 则 可 以 不 存在 补 白 ) 。 

6] 虚拟 机 实现 时 必须 保证 每 一 种 操作 都 是 原子 的 、 不 可 再 分 的 〈 对 于 double 和 long 类 型 的 变量 来 说 ，load、store、tead 和 wtite 操作 在 某 些 平台 上 可 以 有 例外 ， 这 个 问题 留待 后 文 再 讲 ) 。 

7] volatile 屏蔽 指令 重 排序 的 语义 在 JDK 1.5 中 才 被 完全 修复 ， 此 前 的 JDK 中 即使 将 变量 声明 为 volatile 也 仍然 不 能 完全 避免 重 排序 所 导致 的 问题 〈 主 要 是 volatile 变量 前 后 的 代码 仍然 存在 重 排序 问题 ) ， 这 点 
也 是 在 JDK 1.5 之 前 的 Java 中 无 法 安全 地 使 用 DCL ( 双 锁 检测 ) 来 实现 单 例 模 式 的 原因 。 

8] Doug Lea 列 出 了 各 种 处 理 器 架构 下 的 内 存 屏障 指令 : http://g.oswego.edu/dl/jmm/cookbook.html。 








12.4 Java 与 线程 


并 发 不 一 定 要 依赖 多 线程 (如 PHP 中 很 常见 的 多 进程 并 发 ) ， 但 是 在 Java 里 面谈 论 并 发 ， 大 多 数 都 与 线程 脱 不 开关 系 。 既 然 我 们 这 本 书 探讨 的 话题 是 Java 虚 拟 机 的 特性 ， 那 讲 到 Java 线 程 ， 我 们 就 从 
Java 线 程 在 虚拟 机 中 的 实现 开始 讲 起 。 





12.4.1 ”线程 的 实现 


我 们 知道 ， 线 程 是 比 进程 更 轻 量 级 的 调度 执行 单位 ， 线 程 的 引入 ， 可 以 把 一 个 进程 的 资源 分 配 和 执行 调度 分 开 ， 各 个 线程 既 可 以 共享 进程 资源 (内存 地 址 、 文 件 //O 等 ) ， 又 可 以 独立 调度 (线程 是 CPU 
调度 的 最 基本 单位 ) 。 








主流 的 操作 系统 都 提供 了 线程 实现 ，Java 语 言 则 提供 了 在 不 同 硬件 和 操作 系统 平台 下 对 线程 操作 的 统一 处 理 ， 每 个 java.lang.Thread 类 的 实例 就 代表 了 一 个 线程 。 不 过 Thread 类 与 大 部 分 的 Java API 有 
着 显著 的 差别 ， 它 的 所 有 关键 方法 都 被 声明 为 Native。 在 Java API 中 一 个 Native 方 法 可 能 就 意味 着 这 个 方法 没有 使 用 或 无 法 使 用 平台 无 关 的 手段 来 实现 (当然 也 可 能 是 为 了 执行 效率 而 使 用 Native 方 法 , 不 
常 最 高 效率 的 手段 也 就 是 平台 相关 的 手段 ) 。 正 因为 这 个 原因 ， 作 者 把 本 节 的 标题 定 为 “线程 的 实现 ”而 不 是 “Java 线 程 的 实现 ”。 


















































过 通 


























实现 线程 主要 有 三 种 方式 : 使 用 内 核 线程 实现 ， 使 线程 实现 ， 使 用 用 户 线程 加 轻 量 级 进程 混合 实现 。 















































1. 使 用 内 核 线程 实现 




















内 核 线程 (Kernel Thread，KLT) 就 是 直接 由 操作 系统 内 核 (Kernel， 下 称 内 核 ) 支持 的 线程 ， 这 种 线程 由 内 核 来 完成 线程 切换 ， 内 核 通 过 操纵 调度 器 (Scheduler) 对 线程 进行 调度 ， 并 负责 将 线程 
的 任务 映射 到 各 个 处 理 器 上 。 每 个 内 核 线 程 都 可 以 看 做 是 内 核 的 一 个 分 身 ， 这 样 操作 系统 就 有 能 力 同 时 处 理 多 件 事情 ， 支 持 多 线程 的 内 核 就 叫 多 线程 内 核 (Multi-Threads Kernel) 。 






































程序 一 般 不 会 直接 去 使 用 内 核 线程 ， 而 是 去 使 用 内 核 线程 的 一 种 高 级 接口 一 一 轻 量 级 进程 (Light Weight Process，LWP) ， 轻 量 级 进程 就 是 我 们 通常 意义 上 所 讲 的 线程 ， 由 于 每 个 轻 量 级 进程 都 由 一 
个 内 核 线程 支持 ， 因 此 只 有 先 支持 内 核 线程 ， 才 能 有 轻 量 级 进程 。 这 种 轻 量 级 进程 与 内 核 线程 之 间 1 : 1 的 关系 称 为 一 对 一 的 线程 模型 ， 如 图 12-3 所 示 。 





















































12-3 ” 轻 量 级 进程 与 内 核 线程 之 间 1 : 1 的 关系 




















由 于 内 核 线程 的 支持 ， 每 个 轻 量 级 进程 都 成 为 一 个 独立 的 调度 单元 ， 即 使 有 一 个 轻 量 级 进程 在 系统 调用 中 阻塞 了 ， 也 不 会 影响 整个 进程 继续 工作 ， 但 是 轻 量 级 进程 具有 它 的 局 限 性 : 首先 ， 由 于 是 基于 
内 核 线程 实现 的 ， 所 以 各 种 进程 操作 ， 如 创建 、 析 构 及 同步 ， 都 需要 进行 系统 调用 。 而 系统 调用 的 代价 相对 较 高 ， 需 要 在 用 户 态 (User Mode) 和 内 核 态 (Kernel Mode) 中 来 回 切 换 。 其 次 ， 每 个 轻 量 级 
进程 都 需要 有 一 个 内 核 线 程 的 支持 ， 因 此 轻 量 级 进程 要 消耗 一 定 的 内 核资 源 (如 内 核 线程 的 栈 空间 ) ， 因 此 一 个 系统 支持 轻 量 级 进程 的 数量 是 有 限 的 。 
























































2. 使 用 用 户 线程 实现 




















户 线程 ， 但 轻 量 级 进程 的 实现 始终 是 建立 在 内 核 之 上 的 ,许多 











广义 上 来 讲 ， 一 个 线程 只 要 不 是 内 核 线程 ， 那 就 可 以 认为 是 用 户 线程 (User Thread，UT) ， 因 此 从 这 个 定义 上 来 讲 轻 量 级 进程 也 属 了 
操作 都 要 进行 系统 调用 ， 因 此 效率 会 受到 限制 。 
















































































而 狭义 上 的 用 户 线程 指 的 是 完全 建立 在 用 户 空间 的 线程 库 上 ， 系 统 内 核 不 能 感知 到 线程 存在 的 实现 。 线程 的 建立 、 同 步 、 销 毁 和 调度 完全 在 用 户 态 中 完成 ， 不 需要 内 核 的 帮助 。 如 果 程 序 实现 得 
当 ， 这 种 线程 不 需要 切换 到 内 核 态 ， 因 此 操作 可 以 是 非常 快速 且 低 消耗 的 ， 也 可 以 支持 规模 更 大 的 线程 数量 ， 部 分 高 性 能 数据 库 中 的 多 线程 就 是 由 用 户 线程 实现 的 。 这 种 进程 与 用 户 线程 之 间 1 : N 的 关系 称 
为 一 对 多 的 线程 模型 ， 如 图 12-4 所 示 。 
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图 12-4 进程 与 用 户 线程 之 间 1 : N 的 关系 











使 用 用 户 线 程 的 优势 在 于 不 需要 系统 内 核 支 援 ， 劣 势 也 在 于 没有 系统 内 核 的 支援 ， 所 有 的 线程 操作 都 需要 用 户 程序 自己 处 理 。 线 程 的 创建 、 切 换 和 调度 都 是 需要 考虑 问题 ， 而 且 由 于 操作 系统 只 把 处 理 


器 资源 分 配 到 进程 ， 那 诸如 “阻塞 如 何 处 理 ”、 
除了 以 前 在 不 支持 多 线程 的 操作 系统 中 (如 DOS) 





3 .混合 实现 





“多 处 理 器 系统 中 如 何 将 线程 映射 到 其 他 处 理 器 上 ”这 类 


的 多 线程 程序 与 少数 有 特殊 需求 的 程序 儿 








线程 除了 依赖 内 核 线程 实现 和 完全 由 用 户 程序 
在 用 户 空间 中 ， 因 此 
供 的 线程 调度 功能 及 处 理 器 映射 并且 
图 12-5 所 示 ， 这 种 就 是 多 对 多 的 线程 模型 。 



























































户 线程 的 创建 、 切 换 、 析 构 等 操作 依然 廉价 ， 并 且 可 以 支持 大 规模 的 
户 线程 的 系统 调 

















四 





问题 解决 起 来 将 会 异常 困难 ， 甚 至 不 可 能 完成 。 因 而 使 






































自己 实现 之 外 ， 还 有 一 种 将 内 核 线程 与 





线程 的 程序 越 来 越 少 了 ，Java、Ruby 等 语 














户 线程 实现 的 程序 一 般 都 比较 复杂 中 ]， 

















言 都 曾经 使 用 过 上 























户 线程 一 起 使 














户 线 程 ， 最 终 又 都 放弃 了 使 用 它 。 





的 实现 方式 。 在 这 种 混合 实现 下 ， 既 存在 























通过 轻 量 级 线程 来 完成 ， 大 大 


许多 Unix 系 列 的 操作 系统 ， 如 Solaris、HP-UX 等 都 提供 了 M : N 的 线程 模型 实现 。 


4.Java 线 程 的 实现 


Java 线 程 在 JDK 1.2 之 前 ， 是 基于 名 为 “绿色 线程 ” 
支持 怎样 的 线程 模型 ， 在 很 大 程度 上 就 决定 了 Java 虚 拟 机 的 线程 是 怎样 映射 的 ， 这 点 在 不 同 的 平台 上 没有 办 法 达成 一 致 ， 虚 拟 机 规范 中 
程 的 并 发 规模 和 操作 成 本 产生 影响 ， 对 Java 程 序 的 编码 和 运行 过 程 来 说 ， 这 些 差异 都 是 透明 的 。 

















阻塞 的 风险 。 在 这 种 混合 模式 中 ， 











(Green Threads) 的 











户 线程 实现 的 ， 而 在 JDK 1.2 中 ， 线 程 模 # 


。 而 操作 系统 提供 支持 的 轻 量 级 进程 则 作为 




















户 线程 ， 也 存在 轻 量 级 进程 。 
户 线程 和 内 核 线 程 之 间 的 桥梁 ， 这 样 可 以 使 























户 线 程 还 是 完全 建立 
内 核 提 





























户 线程 与 轻 量 级 进程 的 数量 比 是 不 定 的 ， 是 M : N 的 关系 ， 如 











型 被 蔡 换 为 基于 操作 系统 原生 线程 模型 来 实现 。 





此 在 









































也 并 未 限定 Java 线 程 需要 使 





前 的 JDK 版 本 中 ， 操 作 系统 


哪 种 线程 模型 来 实现 。 线 程 模型 只 对 线 














12-5 用 户 线程 与 轻 量 级 进程 之 间 M : N 的 关系 





对 于 Sun JDK 来 说 ， 它 的 Windows 版 与 Linux 版 都 是 使 用 一 对 一 的 线程 模型 来 实现 的 ， 一 条 Java 线 程 就 映射 到 一 条 轻 量 级 进程 之 中 ， 因 为 Windows 和 Linux 系 统 提供 的 线程 模型 就 是 一 对 一 的 由 。 








而 在 Solaris 平 台中 ， 由 于 操作 系统 的 线程 特性 可 以 同时 支持 一 对 一 (通过 Bound Threads 或 Alternate Libthread 实 现 ) 及 多 对 多 (通过 LWP/Thread Based Synchronization 实 现 ) 的 线程 模型 ， 因 此 
在 Solaris 版 的 JDK 中 也 对 应 提供 了 两 个 平台 专 有 的 虚拟 机 参数 : -XX: +UseLWPSynchronization (默认 值 ) 和 -XX: +UseBoundThreads 来 明确 指定 虚拟 机 使 用 的 是 哪 种 线程 模型 。 



































12.4.2 Java 线程 调度 








线程 调度 是 指 系统 为 线程 分 配 处 理 器 使 用 权 的 过 程 ， 主 要 调度 方式 有 两 种 ， 分 别 是 协同 式 (Cooperative Threads-Scheduling) 线程 调度 和 抢占 式 (Preemptive Threads-Scheduling) 线程 调度 。 
































如 果 使 用 协同 式 调度 的 多 线程 系统 ， 线 程 的 执行 时 间 由 线程 本 身 来 控制 ， 线 程 把 自己 的 工作 执行 完了 之 后 ， 要 主动 通知 系统 切换 到 另外 一 个 线程 上 去 。 协 同 式 多 线程 的 最 大 好 处 是 实现 简单 ， 而 且 由 于 
线程 要 把 自己 的 事情 干 完 后 才 会 进行 线程 切换 ， 切 换 操 作对 线程 自己 是 可 知 的 ， 所 以 没有 什么 线程 同步 的 问题 。Lua 语 言 中 的 “协同 例 程 ”就 是 这 类 实现 。 它 的 坏处 也 很 明显 : 线程 执行 时 间 不 可 控制 ， 甚 
至 如 果 一 个 线程 编写 有 问题 ， 一 直 不 告知 系统 进行 线程 切换 ， 那 么 程序 就 会 一 直 阻塞 在 那里 。 很 久 以 前 的 Windows 3.x 系 统 就 是 使 用 协同 式 来 实现 多 进程 多 任务 的 ， 那 是 相当 的 不 稳定 ， 一 个 进程 坚持 不 让 
出 CPU 执行 时 间 就 会 导致 整个 系统 的 崩溃 。 

































































如 果 使 用 抢占 式 调 度 的 多 线程 系统 ， 那 么 每 个 线程 将 由 系统 来 分 配 执行 时 间 ， 线 程 的 切换 不 由 线程 本 身 来 决定 (在 java 中 ，Thread.yield0 可 以 让 出 执行 时 间 ， 但 是 要 获取 执行 时 间 的 话 ， 线 程 本 身 是 没 
有 什么 办 法 的 ) 。 在 这 种 实现 线程 调度 的 方式 下 ， 线 程 的 执行 时 间 是 系统 可 控 的 ， 也 不 会 有 一 个 线程 导致 整个 进程 阻塞 的 问题 ，java 使 用 的 线程 调度 方式 就 是 抢占 式 调度 中 。 与 前 面 所 说 的 Windows 3.x 的 
例子 相对 ， 在 Windows 9x/ NT 内核 中 就 是 使 用 抢占 式 来 实现 多 进程 的 ， 当 一 个 进程 出 了 问题 ， 我 们 还 可 以 使 用 任务 管理 器 把 这 个 进程 杀 掉 ， 而 不 至 于 导致 系统 衣 溃 。 
























































虽然 说 Java 线 程 调度 是 系统 自动 完成 的 ， 但 是 我 们 还 是 可 以 “建议 ”系统 给 某 些 线程 多 分 配 一 点 执行 时 间 ， 另 外 的 一 些 线程 则 可 以 少 分 配 一 点 一 一 这 项 操作 可 以 通过 设置 线程 优先 级 来 完成 。Java 语 言 
一 共 设 置 了 10 个 级 别 的 线程 优先 级 (Thread.MIN_PRIORITY 至 Thread.MAX_PRIORITY) ， 在 两 个 线程 同时 处 于 Ready 状 态 时 ， 优 先 级 越 高 的 线程 越 容易 被 系统 选择 执行 。 








不 过 ， 线 程 优先 级 并 不 是 太 靠 谱 ， 原 因 是 Java 的 线程 是 被 映射 到 系统 的 原生 线程 上 来 实现 的 ， 所 以 线程 调度 最 终 还 是 由 操作 系统 说 了 算 ， 虽 然 现在 很 多 操作 系统 都 提供 线程 优先 级 的 概念 ， 但 是 并 不 见 
得 能 与 java 线程 的 优先 级 一 一 对 应 ， 如 Solaris 中 有 2147483648 (2 的 31 次 方 ) 种 优先 级 ， 但 Windows 中 就 只 有 7 种 ， 比 Java 线 程 优先 级 多 的 系统 还 好 说 ， 中 间 留 下 一 点 空位 就 是 了 ， 但 比 Java 线 程 优先 级 少 
的 系统 ， 就 不 得 不 出 现 几 个 优先 级 相同 的 情况 了 ， 表 12-1 显 示 了 Java 线 程 优先 级 与 Windows 线 程 优先 级 之 间 的 对 应 关系 ，Windows 平 台 的 JDK 中 使 用 了 除 THREAD_PRIORITY_IDLE 之 外 的 其 余 6 种 线程 优先 
级 。 


























表 12-1 Java 线程 优先 级 与 Windows 线 程 优先 级 之 间 的 对 应 关系 





Java 线程 优先 级 Windows 线程 优先 级 





1 (Thread.MIN_PRIORITY ) THREAD_ PRIORIITY LOWEST 

2 THREAD_ PRIORITY LOWEST 

3 THREAD_ PRIORITY BELOW _ NORMAL 
才 THREAD PRIORITY BELOW NORMAL 
5 (Thread.NORM PRIORITY) THREAD _ PRIORITY NORMAL 

6 THREAD PRIORITY ABOVE NORMAL 
THREAD_ PRIORITY ABOVE NORMAL 
8 THREAD_PRIORITY HIGHEST 

9 THREAD_PRIORITY HIGHEST 

10 (Thread.MAX PRIORITY) THREAD_PRIORITY CRITICAL 








上 文 说 到 “线程 优先 级 并 不 是 太 靠 谱 ” ， 不 仅仅 是 说 在 一 些 平台 上 不 同 的 优先 级 实际 会 变 得 相同 这 一 点 ， 还 有 其 他 情况 让 我 们 不 能 太 依赖 优先 级 : 优先 级 可 能 会 被 系统 自行 改变 。 例 如 在 Windows 系 统 
中 存在 一 个 名 为 “优先 级 推进 器 ”的 功能 (Priority Boosting， 当 然 它 可 以 被 关闭 掉 ) ， 它 的 大 致 作用 就 是 当 系统 发 现 一 个 线程 被 执行 得 特别 “勤奋 努力 ”的 话 ， 可 能 会 越过 线程 优先 级 去 为 它 分 配 执行 时 
间 。 因 此 我 们 不 能 在 程序 中 通过 优先 级 来 完全 准确 地 判断 一 组 状态 都 为 Ready 的 线程 将 会 先 执行 哪 一 个 。 





12.4.3 ”状态 转换 





Java 语 言 定义 了 5 种 进程 状态 ， 在 任意 一 个 时 间 点 中 ， 一 个 进程 只 能 有 且 只 有 其 中 的 一 种 状态 ， 这 5 种 状态 分 别 是 : 
“新建 (New) : 创建 后 尚未 启动 的 线程 处 于 这 种 状态 。 
“ 运行 (Runable) : Runable 包 括 了 操作 系统 线程 状态 中 的 Running 和 Ready， 也 就 是 处 于 此 状态 的 线程 有 可 能 正在 执行 ， 也 有 可 能 正在 等 待 着 CPU 为 它 分 配 执行 时 间 。 
“ 无 限期 等 待 《Waiting) : 处 于 这 种 状态 的 进程 不 会 被 分 配 CPU 执行 时 间 ， 它 们 要 等 待 被 其 他 线程 显 式 地 唤醒 。 以 下 方法 会 让 线程 陷入 无 限期 的 等 待 状态 : 
: 没有 设置 Timeout 参 数 的 Objectwait0 方 法 。 
: 没有 设置 Timeout 参 数 的 Thread.join0 方 法 。 
“ LockSupport.park0 方 法 。 


“ 限期 等 待 (Timed Waitting) : 处 于 这 种 状态 的 进程 也 不 会 被 分 配 CPU 执 行 时 间 ， 不 过 无 须 等 待 被 其 他 线程 显 式 地 唉 醒 ， 在 一 定时 间 之 后 它们 会 由 系统 自动 唉 醒 。 以 下 方法 会 让 线程 进入 限期 等 待 状 


Thread.sleep0 方 法 。 

:设置 了 Timeout 参 数 的 Objectwait0 方 法 。 
:设置 了 Timeout 参 数 的 Thread.join0 方 法 。 
“LockSupportpatkNanos(0 方 法 。 
"LockSupportparkUntil0 方 法。 


“ 阻塞 (Blocked) : 进程 被 阻塞 了 ，“ 阻 塞 状态 ”与 “等 待 状态 ”的 区 别 是 : “阻塞 状态 ”在 等 待 着 获取 到 一 个 排 它 锁 ， 这 个 事件 将 在 另外 一 个 线程 放弃 这 个 锁 的 时 候 发 生 ; 而 “等 待 状态 ” 则 是 在 等 
待 一 段 时 间 ， 或 者 唤醒 动作 的 发 生 。 在 程序 等 待 进入 同步 区 域 的 时 候 ， 线 程 将 进入 这 种 状态 。 


“ 结束 (Terminated) : 已 终止 线程 的 线程 状态 ， 线 程 已 经 结束 执行 。 





上 述 5 种 状态 在 遇 到 特定 事件 发 生 的 时 候 将 会 互相 转换 ， 它 们 的 转换 关系 如 图 12-6 所 示 。 
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图 12-6 ”线程 状态 转换 关系 
[由 此 处 所 讲 的 “复杂 ”与 “程序 自己 完成 线程 操作 ”， 并 没有 限制 程序 中 必须 编写 了 复杂 的 用 于 实现 用 户 线程 的 代码 ， 使 用 用 户 线程 的 程序 ， 很 多 都 依赖 特定 的 线程 库 来 完成 基本 的 线程 操作 ， 这 些 复杂 性 
都 封装 在 线程 库 之 中 。 
四 Windows 下 有 纤 程 包 (Fiber Package) ，Linux 下 也 有 NGPT (在 2.4 内 核 的 年 代 ) 来 实现 M : N 模型 ， 但 是 它们 都 没有 成 为 主流 。 
DB] 在 JDK 1.7 中 有 可 能 会 提供 协 程 (Coroutines) 方式 来 进行 多 任务 处 理 ， 相 关 资 料 可 参见 http://wikis.sun.com/display/mlvm/Coroutines。 


12.5 本章 小 结 

















本 章 中 ， 我 们 了 解 了 虚拟 机 Java 内 存 模型 的 结构 及 操作 ， 并 且 讲解 了 原子 性 、 可 见 性 、 有 序 性 在 java 内存 模型 中 的 体现 ， 介 绍 了 先行 发 生 原 则 的 规则 及 使 用 。 另 外 ， 我 们 还 了 解 了 线程 在 java 语言 之 中 
是 如 何 实现 的 。 





关于 “高 效 并 发 ”这 个 话题 ， 在 本 章 中 主要 介绍 了 虚拟 机 如 何 实现 “并 发 ”， 在 下 一 章 中 ， 我 们 的 主要 关注 点 将 是 虚拟 机 如 何 实现 “高效 并 发 ”， 虚 拟 机 对 我 们 编写 的 并 发 代码 提供 了 什么 样 的 优化 手 
段 。 














第 13 章 ”线程 安全 与 锁 优化 


本 章 主要 内 容 





“概述 


“ 线程 安全 


“ 锁 优 化 














并 发 处 理 的 广泛 应 用 是 使 得 Amdahl 定 律 代替 摩尔 定律 成 为 计算 机 性 能 发 展 源 动 力 的 根本 原因 ， 也 是 人 类 压榨 计算 机 运算 能 力 最 有 力 的 武器 。 

















13.1 概述 


























在 软件 业 发 展 的 初期 ， 程 序 编写 都 是 以 算法 为 核心 的 ， 程 序 员 会 把 数据 和 过 程 分 别 作为 独立 的 部 分 来 考虑 ， 数 据 代表 问题 空间 中 的 客体 ， 程 序 代码 则 用 于 处 理 这 些 数据 ， 这 种 思维 方式 是 直接 站 在 计算 


机 的 角度 去 抽象 问题 和 解决 问题 ， 称 为 面向 过 程 的 编程 思想 。 与 此 相对 ， 面 向 对 象 的 编程 思想 则 站 在 现实 世界 的 角度 去 抽象 和 解决 问题 ， 它 把 数据 和 行为 都 看 做 是 对 象 的 一 部 分 ， 这 样 可 以 让 程序 员 能 以 符 
合 现实 世界 的 思维 方式 来 编写 和 组 织 程序 。 








面向 过 程 的 编程 思想 极 大 地 提升 了 现代 软件 开发 的 生产 效率 和 软件 可 以 达到 的 规模 ， 但 是 现实 世界 与 计算 机 世界 之 间 不 可 避免 地 存在 一 些 差异 。 例 如 ， 人 们 很 难 想象 现实 中 的 对 象 在 一 项 工作 进行 期 
间 ， 会 被 不 停 地 中 断 和 切换 ， 对 象 的 属性 (数据 ) 可 能 会 在 中 断 期 间 被 修改 和 变 脏 ， 而 这 些 事件 在 计算 机 世界 中 则 是 很 正常 的 事情 。 有 时 候 ， 良 好 的 设计 原则 不 得 不 向 现实 做 出 一 些 让 步 ， 我 们 必须 让 程序 
在 计算 机 中 正确 无 误 地 运行 ， 然 后 再 考虑 如 何 将 代码 组 织 得 更 好 ， 让 程序 运行 得 更 快 。 对 于 这 部 分 的 主题 “高 效 并 发 ”来 讲 ， 首 先 需要 保证 并 发 的 正确 性 ， 然 后 在 此 基础 上 来 实现 高 效 。 本 章 就 先 从 如 何 保 
证 并 发 的 正确 性 ， 如 何 实现 线程 安全 说 起 。 























13.2 ”线程 安全 


笔者 认为 《Java Concurrency In Practice》 














不 需要 进行 额外 的 同步 ， 或 者 在 调 


这 个 定义 很 严 遵 ， 它 
线程 的 正确 调 


























方 进 行 任何 其 他 的 协调 操作 ， 调 





























求 了 线程 安全 的 代码 必须 都 












































程 安全 的 了 ， 为 什么 要 弱化 这 个 定义 ， 我 们 稍 后 再 详细 探讨 。 


业 3 汉 本 





Java 语 言 中 的 线程 安全 


的 作者 Brian Goetz 对 “线程 安全 ”有 一 个 比较 恰当 


。 这 点 并 不 容易 做 到 ， 在 大 多 数 场景 中 ， 我 们 都 会 将 这 个 定义 弱化 一 些 ， 如 果 把 “ 调 








“线程 安全 ”这 个 名 称 ， 相 信 稍 有 经 验 的 程序 员 都 会 听 说 过 ， 甚 至 在 代码 编写 和 走 查 的 时 候 可 能 还 会 经 常 挂 在 嘴 边 ， 但 是 如 何 找到 一 个 不 太 撩 口 的 概念 来 定义 线程 安全 却 不 是 一 件 容易 的 事情 ， 笔 者 尝 
试 在 Google 中 搜索 它 的 概念 ， 找 到 的 是 类 似 于 “如 果 一 个 对 象 可 以 安全 地 被 多 个 线程 同时 使 用 ， 那 它 就 是 线程 安全 的 ”这 样 的 定义 一 一 并 不 能 说 它 不 正确 ， 但 是 令 人 无 法 从 中 获取 到 任何 有 

















的 信息 。 














的 定义 : “ 当 多 个 线程 访问 一 个 对 象 时 ， 如 果 不 用 考虑 这 些 线程 在 运行 时 环境 下 的 调度 和 交替 执行 ， 也 
这 个 对 象 的 行为 都 可 以 获得 正确 的 结果 ， 那 这 个 对 象 就 是 线程 安全 的 ” 




















备 一 个 特征 : 代码 本 身 封装 了 所 有 必要 的 正确 性 保障 手段 (如 互 斥 同步 等 ) ， 仿 调 











者 无 须 关心 多 线程 的 问题 ， 更 无 须 自己 实现 任何 措施 来 保证 多 





























这 个 对 象 的 行为 ”限定 为 “ 单 次 调 


























”， 这 个 定义 的 其 他 描述 也 能 够 成 立 的 话 ， 我 们 就 可 以 称 它 是 线 


我 们 已 经 有 了 线程 安全 的 一 个 抽象 定义 ， 那 接 下 来 我 们 就 讨论 一 下 在 Java 语 言 中 ， 线 程 安全 具体 是 如 何 体现 的 ? 有 哪些 操作 是 线程 安全 的 ?我 们 这 里 讨论 的 线程 安全 ， 就 限定 于 多 个 线程 之 间 存 在 共享 


数据 访问 这 个 前 提 ， 因 为 如 果 一 段 代 码 根本 不 会 与 其 他 线程 共享 数据 ， 那 么 从 线程 安全 的 角度 上 看 ， 程 序 是 
为 了 更 深入 地 理 


1. 不 可 变 


在 Java 语 言 里 面 ( 特 指 JDK 1.5 以 后 ， 即 Java 内 存 模型 被 修正 











绝对 线程 安全 、 相 对 线程 安全 、 线 程 兼容 和 线程 对 立 。 








有 行 执行 还 是 多 线程 执行 对 它 来 说 是 完全 没有 区 别 的 。 





解 线程 安全 ， 在 这 里 我 们 可 以 不 把 线程 安全 当 作 一 个 非 真 即 假 的 二 元 排 它 选 项 来 看 待 ， 按 照 线程 安全 的 “安全 程度 ”由 强 至 弱 来 排序 ， 我 们 [1] 可 以 将 Java 语 言 中 各 种 操作 共享 的 数据 分 
为 以 下 五 类 : 不 可 变 、 
































后 的 Java 语 言 ) ， 不 可 变 (Immutable) 的 对 象 一 定 是 线程 安全 的 ， 无 论 是 对 象 的 方法 实现 还 是 方法 的 调用 者 ， 都 不 需要 再 进行 任何 的 线 

















程 安全 保障 措施 ， 在 上 一 章 里 我 们 谈 到 过 final 关 键 字 带 来 的 可 见 性 时 曾经 提 到 过 这 一 点 ， 只 要 一 个 不 可 变 的 对 象 被 正确 地 构建 出 来 (没有 发 生 this 引 用 逃逸 的 情况 ) ， 那 其 外 部 的 可 见 状态 永远 也 不 会 改 


变 ， 永 远 也 不 会 看 到 它 在 多 个 线程 之 中 处 于 不 一 致 的 状态 。 


Java 语 























“不 可 变 ” 带 来 的 安全 性 是 最 简单 最 纯粹 的 。 























言 中 ， 如 果 共 享 数据 是 一 个 基本 数据 类 型 那么 只 要 在 定义 时 使 
才 行 ， 如 果 读者 还 没 想 明白 





构造 的 字符 串 对 象 。 

















这 句 话 ， 不 妨 想 一 想 java.lang.String 类 的 对 象 ， 它 是 一 个 典型 的 不 可 变 对 象 ， 我 们 调 





























final 关 键 字 修饰 它 就 可 以 保证 它 是 不 可 变 的 。 如 果 共享 数据 是 一 个 对 象 ， 那 就 需要 保证 对 象 的 行为 不 会 对 其 状态 产生 任何 影响 
它 的 substring0、replace0 和 concat( 这 些 方法 都 不 会 影响 它 原 来 的 值 ， 只 会 返回 一 个 新 











保证 对 象 行为 不 影响 自己 状态 的 途径 有 很 多 种 ， 其 中 最 简单 的 就 是 把 对 象 中 带 有 状态 的 变量 都 声明 为 final， 这 样 在 构造 函数 结束 之 后 ， 它 就 是 不 可 变 的 ， 例 如 代码 清单 13-1 中 java.lang.Integer 构 造 函 
数 所 示 的 ， 它 通过 将 内 部 状态 变量 value 定 义 为 final 来 保障 状态 不 变 。 


代码 清单 13-1 


* @param 
* 

















JDK 中 Integer 类 的 构造 函数 


六 

* The Value of the <code>Integer</code>. 
* Qserial 

RR 


private final int value; 
大 大 


value the value to be represented by the 
<code>Integer</code> object. 


Wy 


public Integer (int value) { 


} 


this.value = value; 





* Constructs a newly allocated <code>Integer</code> object that 
* represents the specified <code>int</code> value. 
x 


在 Java APl 中 符合 不 可 变 要 求 的 类 型 ， 除 了 上 面 提 到 的 String 之 外 ， 常 用 的 还 有 枚 举 类 型 ， 以 及 java.lang.Number 的 部 分 子 类 ， 如 Long 和 Double 等 数值 包装 类 型 ，Biglnteger 和 BigDecimal 等 大 数据 


类 型 ; 但 同 为 Number 的 子 类 型 的 原子 类 Atomiclnteger 和 AtomicLong 则 并 非 不 可 变 的 ， 读 者 不 妨 看 看 这 两 个 原子 类 的 源码 ， 想 一 想 为 什么 。 











2. 绝 对 线程 安全 


绝对 的 线程 安全 完全 满足 Brian Goetz 给 出 的 线程 安全 的 定义 ， 这 个 定义 其 实 是 很 严格 的 ， 一 个 类 要 达到 “不管 运 行 时 环境 如 何 ， 调 
切实 际 的 代价 。 在 Java API 中 标注 自己 是 线程 安全 的 类 ， 大 多 数 都 不 是 绝对 的 线程 安全 。 我 们 可 以 通过 Java API 中 一 个 不 是 “绝对 线程 安 


如 果 说 java.util.Vector 是 一 个 线程 安全 的 容器 ， 相 信 所 有 的 Java 程 序 员 对 此 都 不 会 有 异议 ， 
但 是 ， 即 使 它 所 有 的 方法 都 被 修饰 成 同步 ， 也 不 意味 着 调 
































代码 清单 13-2 ”对 Vector 线 程 安全 的 测试 


























者 都 不 需 


任何 额外 的 同步 措施 ”通常 需要 付出 很 大 的 ， 甚 至 是 不 
的 线程 安全 类 来 看 看 这 里 的 “绝对 ”是 什么 意思 。 



































因为 它 的 add0、get0 和 size() 这 类 方法 都 是 被 Synchronized 修 饰 的 ， 尽 管 这 样 效率 很 低 ， 但 确实 是 安全 的 。 
它 的 时 候 永远 都 不 再 需要 同步 手段 了 ， 请 看 看 下 面 代 码 清单 13-2 中 的 测试 代码 。 





private static Vector<Integer> vector = new Vector<Integer> () 
public static void main (String[] args) { 


while (true) { 


for (int 1 = Di i < 10 11+) { 
vector.add (i); 
} 
Thread removeThread = new Thread(new Runnable() { 
@Override 
public void run() { 
for (int i = 0; i < vector.size(); 
Vector .remove (i); 


Le 


} 
} 
}; 
Thread printThread = new Thread(new Runnable() { 
@Override 
public void run() { 
for (int i = 0; i < vector.size(); i++) { 
System.out .println( (vector.get (i))); 
} 
} 
1 
removeThread. start (); 
printThread. start (); 
// 不 要 同时 产生 过 多 的 线程 ， 否 则 会 导致 操作 系统 假死 
while (Thread.activeCount () > 20) 


运行 结果 如 下 : 


Exception in thread "Thread-132" 
java.lang.ArrayIndexOutOfBoundsException: 


Array index out of range: 


17 


at java.util.Vector.remove (Vector.java:777) 
at org.fenixsoft.mulithread.VectorTest$1.run (VectorTest .java:21) 
at java.lang.Thread.run (Thread.java:662) 











很 明显 ， 尽 管 这 里 使 用 到 的 Vector 的 get0、remove0 和 size() 方 法 都 是 同步 的 ， 但 是 在 多 线程 的 环境 中 ， 如 果 不 在 方法 调用 端 做 额外 的 同步 措施 ， 使 用 这 段 代 码 仍然 是 不 安全 的 ， 因 为 如 果 另 一 个 线程 














恰好 在 错误 的 时 间 里 删除 了 一 个 7 
printThread 的 定义 改 成 如 下 面 代 




















5 素 ， 导 致 序号 已 经 不 再 可 用 的 话 ，get() 方 法 就 会 抽出 一 个 ArraylndexOutOfBoundsException。 如 果 要 保证 这 段 代 码 能 正确 地 执行 下 去 ， 我 们 不 得 不 把 removeThread 和 








码 清单 13-3 所 示 的 这 样 。 





代码 清单 13-3 ”必须 加 入 同步 以 保证 Vector 访问 的 线程 安全 性 





Thread removeThread = new 
QOverride 
public void run() { 


Thread (new Runnable() { 


synchronized (vector) { 
for (int i = 0; i < vector.size(); i++) 
Vector .remove (i); 


} 
} 
} 
}; 


QOverride 
public void run() { 


Thread printThread = new Thread (new Runnable() { 


synchronized (vector) { 
for (int i = 0; i < vector.size(); i++) 


System.out .println( (vector.get (i))); 


} 


3. 相 对 线程 安全 


{ 


{ 











相对 的 线程 安全 就 是 我 们 通常 意义 上 所 讲 的 线程 安全 ， 它 需 








在 调用 端 使 用 额外 的 同步 手段 来 保证 调 












































在 Java 语 言 中 ， 大 部 分 的 线程 安全 类 都 


4. 线 程 兼 容 





的 正确 性 。 上 面 代码 清和 


















































保证 对 这 个 对 象 单独 的 操作 是 线程 安全 的 ， 我 们 在 调用 的 时 候 不 需要 做 额外 的 保障 措施 ， 但 是 对 于 一 些 特定 顺序 的 连续 调用 ， 就 可 能 需 
和 E13-2 和 代码 清单 13-3 就 是 相对 线程 安全 的 一 个 很 明显 的 案例 。 

















线程 兼容 是 指 对 象 本 身 并 不 是 线程 安全 的 ， 但 是 可 以 通过 在 调 





API 中 大 部 分 的 类 都 是 线程 兼容 的 


5. 线 程 对 立 






































， 如 与 前 面 的 Vector 和 HashTable 相 对 应 的 集合 类 ArrayList 和 HashMap 等 。 












































属于 这 种 类 型 ， 例 如 Vector、HashTable、Collections 的 synchronizedCollection() 方 法 包装 的 集合 等 。 


端正 确 地 使 用 同步 手段 来 保证 对 象 在 并 发 环境 中 安全 地 使 用 ， 我 们 平常 说 一 个 类 不 是 线程 安全 的 ， 绝 大 多 数 指 的 都 是 这 种 情况 。Java 


线程 对 立 是 指 不 管 调 用 端 是 否 采 取 了 同步 措施 ， 都 无 法 在 多 线程 环境 中 并 发 使 用 的 代码 。 由 于 Java 语 言 天 生 就 具备 多 线程 特性 ， 线 程 对 立 这 种 排斥 多 线程 的 代码 是 很 少 出 现 的 ， 而 且 通 常 都 是 有 害 的 ， 





应 当 尽量 避免 。 






































一 个 线程 对 立 的 例子 是 Thread 类 的 suspend0 和 resume() 方 法 ， 如 果 有 两 个 线程 同时 持 有 一 个 线程 对 象 ， 一 个 尝试 去 中 断 线 程 ， 一 个 尝试 去 恢复 线程 ， 如 果 并 发 进行 的 话 ， 无 论调 用 时 是 否 进行 了 同 


步 ， 目 标 线程 都 是 存在 死 锁 风险 的 ， 如 果 suspend() 中 断 的 线程 就 是 即将 要 执行 resume() 的 那个 线程 ， 那 就 肯定 要 产生 死 锁 了 。 也 正 是 由 于 这 个 原 








(@Deprecated) 了 。 常 见 的 线程 对 立 的 操作 还 有 System.setln0、Sytem.setOut(0 和 System.runFinalizersOnExit( 等 。 


13.2.2 ”线程 安全 的 实现 方法 


了 解 了 什么 是 线程 安全 之 后 ， 紧 接着 的 一 个 问题 就 是 我 们 应 该 如 何 实现 线程 安全 ， 这 听 起 来 似乎 是 一 件 由 代码 如 何 编写 来 决定 的 导 




















因 ，suspend0 和 resume() 方 法 已 经 被 JDK 声 明 废 弃 














情 ， 确 实 ， 如 何 实现 线程 安全 与 代码 的 编写 有 很 大 的 关系 ， 但 虚拟 机 











提供 的 同步 和 锁 机 制 也 起 到 了 非常 重要 的 作用 。 本 节 将 介绍 代码 编写 如 何 实现 线程 安全 和 虚拟 机 如 何 实现 同步 与 锁 ， 相 对 而 言 更 偏重 后 者 一 些 ， 只 要 读者 了 解 了 虚拟 机 线程 安全 手段 的 运作 过 程 ， 自 己 去 思 
考 代 码 如 何 编写 并 不 是 一 件 困难 的 事情 。 





1. 互 斥 同步 


互 斥 同步 (Mutual Exclusion&Synchronization) 是 最 常见 的 一 种 并 发 正确 性 保障 手段 ， 同 步 是 指 在 多 个 线程 并 发 访问 共享 数据 时 ， 保 证 共享 数据 在 同一 个 




















时 候 ) 线程 使 用 。 而 互 斥 是 实现 同步 的 一 种 手段 ， 临 界 区 (Critical Section) 、 互 斥 量 (Mutex) 和 信号 量 (Semaphore) 都 是 主要 的 互 斥 实现 方式 。 











方法 ， 同 步 是 目的 。 




















在 java 里面 ， 最 基本 的 互 斥 同 


步 手段 就 是 synchronized 关 键 字 ，synchronized 关 键 字 经 过 编译 之 后 ， 会 在 同步 块 的 前 后 分 别 于 



































此 在 这 








时 刻 只 被 一 条 (或 者 是 一 些 ， 使 用 信号 量 的 

















9 个 字 里 面 ， 互 斥 是 因 ， 同 步 是 果 ， 互 斥 是 

















成 monitorenter 和 monitorexit 这 两 个 字 节 码 指令 ， 这 两 个 字 节 码 都 需要 


一 个 reference 类 型 的 参数 来 指明 要 锁定 和 解锁 的 对 象 。 如 果 Java 程 序 中 的 synchronized 明 确 指定 了 对 象 参数 ， 那 就 是 这 个 对 象 的 reference; 如 果 没 有 明确 指定 ， 那 就 根据 synchronized 修 饰 的 是 实例 方法 
还 是 类 方法 ， 去 取 对 应 的 对 象 实例 或 Class 对 象 来 作为 锁 对 象 。 


根据 虚拟 机 规范 的 要 求 ， 在 执 

















在 虚拟 机 规范 对 monitorenter 和 monitorexit 的 行为 描述 中 ， 有 两 点 是 需要 特别 注意 的 。 首 先 ，synchronized 同 步 块 对 同一 条 线程 来 说 是 可 得 


已 进入 的 线程 执行 完 之 前 ， 会 阻塞 后 面 其 他 线程 的 进入 。 上 一 章 讲 过 ，Java 的 线程 是 映射 到 操作 系统 的 原生 线程 之 上 的 ， 如 果 要 阻塞 或 
到 核心 态 中 ， 因 此 状态 转换 需要 耗费 很 多 的 处 理 器 时 间 。 对 于 代码 简 生 
synchronized 是 Java 语 言 中 一 个 重量 级 (Heavyweight) 的 操作 ， 有 经 验 的 程序 员 都 会 在 确实 必要 的 情况 下 才 使 用 这 种 操作 。 而 虚拟 机 本 身 也 会 进行 一 些 优化 ， 





自 旋 等 待 过程 ， 避 免 频 繁 地 切入 型 











核心 态 之 中 。 


























的 同步 块 (如 被 synchronized 修 饰 的 getter 















































到 对 象 锁 被 另外 一 个 线程 释放 为 止 。 





行 monitorenter 指 令 时 ， 首 先 要 去 尝试 获取 对 象 的 锁 。 如 果 这 个 对 象 没 被 锁定 ， 或 者 当前 线程 已 经 拥有 了 那个 对 象 的 锁 ， 把 锁 的 计数 器 加 1， 相 应 地 ， 在 执行 monitorexit 
指令 时 会 将 锁 计数 器 减 1， 当 计数 器 为 0 时 ， 锁 就 被 释放 了 。 如 果 获 取 对 象 锁 失 败 了 ， 那 当前 线程 就 要 阻塞 等 待 ， 直 














看 入 的 ， 不 会 出 现 自己 把 自己 锁 死 的 问题 。 其 次 ， 同 步 块 在 























负 醒 一 条 线程 ， 都 需 
(或 setter() 方 法 ) ， 状 态 转 换 消耗 的 时 间 可 能 比 用 户 代码 执行 的 时 间 还 要 长 。 所 以 








操作 系统 来 帮忙 完成 ， 这 就 需要 从 用 户 态 转 换 





























璧 如 在 通知 操作 系统 阻塞 线程 之 前 加 入 一 段 























除了 synchronized 之 外 ， 我 们 还 可 以 使 用 ava.util.concurrent (下 文 称 上 JU.C) 包 中 的 重 入 锁 (ReentrantLock) 来 实现 同步 ， 在 基本 用 法 上 ，ReentrantLock 与 synchronized 很 相似 ， 他 们 都 具备 一 样 














的 线程 重 入 特性 ， 只 是 代码 写法 上 有 点 区 别 ， 一 个 表现 为 API 层 
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征 锁 (lock0 和 unlock() 方 法 配合 try/finally 语 句 块 来 完成 ) ， 一 个 表现 为 原 


增加 了 一 些 高 级 功能 ， 主 要 有 以 下 三 项 : 等 待 可 中 断 、 可 实现 公平 锁 ， 以 及 锁 可 以 绑 定 多 个 条 件 。 











语法 层 


H 











的 互 


奈 锁 。 不 过 ReentrantLockttsynchronized 


“ 等待 可 中 断 是 指 当 持 有 锁 的 线程 长 期 不 释放 锁 的 时 候 ， 正 在 等 待 的 线程 可 以 选择 放弃 等 待 ， 改 为 处 理 其 他 事情 ， 可 中 断 特性 对 处 理 执行 时 间 非 常 长 的 同步 块 很 有 帮助 。 


“ 公平 锁 是 指 多 个 线程 在 等 待 同一 个 锁 时 ， 必 须 按 照 申 请 锁 的 时 间 顺 序 来 依次 获得 锁 ; 而 非 公 平 锁 则 不 保证 这 一 点 ， 在 锁 被 释放 时 ， 任 何 一 个 等 待 锁 的 线程 都 有 机 会 获得 锁 。synchronized 中 的 锁 是 非 公 
平 的 ，ReentrantLock 黑 认 情 况 下 也 是 非 公平 的 ， 但 可 以 通过 带 布尔 值 的 的 构造 函数 要 求 使 用 公平 锁 。 


“ 锁 绑 定 多 个 条 件 是 指 一 个 ReentrantLock 对 象 可 以 同时 绑 定 多 个 Condition 对 象 ， 而 在 synchtonized 中 ， 锁 对 象 的 wait0 和 notify0 或 notifyAll0 方 法 可 以 实现 一 个 隐 含 的 条 件 ， 如 果 要 和 多 于 一 个 的 条 件 关联 的 
时 候 ， 就 不 得 不 额外 地 添加 一 个 锁 ， 而 ReentrantLock 则 无 须 这样 做 ， 只 需要 多 次 调用 newCondition0 方法 即 可 。 


如 果 需 要 使 用 到 上 述 功 能 的 时 候 ， 选 用 ReentrantLock 是 一 个 很 好 的 选择 ， 那 如 果 是 基于 性 能 考虑 呢 ? 关于 synchronized 和 ReentrantLock 的 性 能 问题 ，Brian Goetz 对 这 两 种 锁 在 JDK 1.5、 单 核 处 理 
器 及 双 Xeon 处 理 器 环境 下 做 了 一 组 吞吐 量 对 比 的 实验 门 ， 实 验 结果 如 图 13-1 和 图 13-2 所 示 。 
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图 13-1 JDK 1.5、 单 核 处 理 器 下 两 种 锁 的 吞吐 量 对 比 


从 图 13-1 和 图 13-2 可 以 看 出 ， 多 线程 环境 下 synchronized 的 吞吐 量 下 降 得 非常 严重 ， 而 ReentrantLock 则 能 基本 保持 在 同一 个 比较 稳定 的 水 平 上 。 与 其 说 ReentrantLock 性 能 好 ， 倒 还 不 如 说 
synchronized 还 有 非常 大 的 优化 余地 。 后 续 的 技术 发 展 也 证 明了 这 一 点 ，JDK 1.6 中 加 入 了 很 多 针对 锁 的 优化 措施 (下 一 节 我 们 就 会 讲解 这 些 优化 措施 ) ，JDK 1.6 发 布 之 后 ， 人 们 就 发 现 synchronized 与 
ReentrantLock 的 性 能 基本 上 是 完全 持平 了 。 因 此 如 果 读 者 的 程序 是 使 用 JDK 1.6 部 署 的 话 ， 性 能 因素 就 不 再 是 选择 ReentrantLock 的 理由 了 ， 虚 拟 机 在 未 来 的 性 能 改进 中 肯定 也 会 更 加 偏向 于 原生 的 
synchronized， 所 以 还 是 提倡 在 synchronized 能 实现 需求 的 情况 下 ， 优 先 考虑 使 用 synchronized 来 进行 同步 。 
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2. 非 阻塞 同步 


互 斥 同步 最 主要 的 问题 就 是 进行 线程 阻塞 和 唤醒 所 带 来 的 性 能 问题 ， 
， 无 论 共享 数据 是 否 真 的 会 出 现 竞争 ， 它 都 





同步 措施 (加 锁 ) ， 那 就 肯定 会 


出 现 问题 


Dual XeonHT (Linux) 























因此 这 种 同步 也 被 称 为 阻塞 同步 (Blocking Synchronization) 。 另 外 ， 它 




















就 成 功 了 ; 如 果 共 享 数 据 有 争 











操作 被 称 为 非 阻塞 同步 (Non-Blocking Synchronization) 。 








为 什么 笔者 说 使 








乐观 并 发 策略 需要 “硬件 指令 集 的 发 展 ” 才 能 进行 呢 ? 











我 们 只 能 靠 硬件 来 完成 这 件 事 情 ， 硬 件 保证 一 个 从 语义 上 看 起 来 需要 多 次 操作 的 行为 只 通过 一 条 处 理 器 指令 就 能 完成 ， 这 类 指令 常 





:测试 并 设置 (Testrand-Set) ; 


. 获取 并 增加 (Fetch-and-Increment) ; 


. 交换 (Swap) ; 


“ 比较 并 交换 (Compare-and-Swap， 下 文 称 CAS) ; 


' 加 载 链接 /条 件 储存 (Load-Linked/Store-Conditional ， 下 文 称 LL/SC) 。 





CAS 功 能 ， 在 sparc-TSO 中 也 有 casa 指 令 实现 ， 而 在 ARM 和 PowerPC 架 构 下 ， 则 需要 使 


CAS 指 令 需 要 有 三 个 操作 数 ， 分 别 是 内 存 位 置 (在 Java 中 可 以 简单 理解 为 变量 的 内 存 
新 值 B 更 新 V 的 值 ， 否 则 它 就 不 执行 更 新 ， 但 是 不 管 是 否 更 新 了 V 的 值 ， 都 会 返回 











处 理 器 








其 中 ， 前 面 的 三 条 是 上 个 世纪 就 已 经 存在 于 大 多 数 指令 集 之 中 的 处 理 器 指令 ， 后 面 的 


























也 址 ， 


进行 加 锁 (这 里 说 的 是 概念 模型 ， 实 际 上 虚拟 机 会 优化 掉 很 大 一 部 分 不 必 
数 器 和 检查 是 否 有 被 阻塞 的 线程 需要 被 唤醒 等 操作 。 随 着 硬件 指令 集 的 发 展 ， 我 们 有 了 另外 一 个 选择 : 基于 冲突 检测 的 乐观 并 发 策略 ， 通 俗 地 说 就 是 先进 行 操作 ， 如 果 没有 其 他 线程 
， 产 生 了 冲突 ， 那 就 再 进行 其 他 的 补偿 措施 (最 常见 的 补偿 措施 就 是 不 断 地 











因为 我 们 需要 操作 和 冲突 检测 这 两 个 步骤 具备 原子 性 ， 靠 什么 来 保证 呢 ? 如 果 这 里 F 


量 试 ， 直 到 试 成 功 为 止 )， 这 种 乐观 的 并 发 策略 的 许多 实现 都 不 需要 把 线程 


13-2 JDK 1.5、 双 Xeon 处 理 器 下 两 种 锁 的 知 吐 量 对 比 




















的 加 锁 ) 、 
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的 有 : 





的 功能 。 



































V 的 旧 值 ， 








V 表 示 ) 、 旧 的 预期 值 (上 














属于 一 种 翡 观 的 并 发 策略 ， 总 是 认为 只 要 不 去 做 正确 的 
户 态 核心 态 转换 、 维 护 锁 计 
共享 数据 ， 那 操作 


因此 这 种 同步 





互 斥 同步 来 保证 就 失去 意义 了 ， 所 以 


两 条 是 现代 处 理 器 新 增 的 ， 而 且 这 两 条 指令 的 目的 和 功能 是 类 似 的 。 在 IA64、x86 指 令 集中 通过 cmpxchg 指 令 完 
一 对 Idrex/strex 指 令 来 完成 LL/SC 


A 表示 ) 和 新 值 (用 B 表 示 ) 。CAS 指 令 执 行 时 ， 当 且 仅 当 V 符 合 | 日 预期 值 A 时 ， 


上 述 的 处 理 过 程 是 一 个 原子 操作 。 


在 JDK 1.5 之 后 ，Java 程 序 中 才 可 以 使 用 CAS 操 作 ， 该 操作 由 sun.misc.Unsafe 类 里 面 的 compareAndSwaplnt0 和 compareAndSwapLong() 等 几 个 方法 包装 提供 ， 虚 拟 机 在 内 部 对 这 些 方法 做 了 特殊 处 


理 ， 即 时 编译 出 来 的 结果 就 是 一 条 平台 相关 的 处 理 器 CAs 指 令 ， 没 有 方法 调 


由 于 Unsafe 类 不 是 提供 给 用 户 程序 调用 的 类 (Unsafe.getUnsafe() 的 代码 中 限制 了 只 有 
的 整数 原子 类 ， 其 中 的 compareAndSset0 和 getAndlncrement() 等 方法 都 使 有 











的 Java APl 来 间接 使 











我 们 不 妨 拿 一 段 在 上 一 章 中 没有 解决 的 问题 代码 来 看 看 如 何 使 


它 ， 如 J.U.C 包 里 面 
































备 原子 性 ， 那 么 如 何 才能 让 它 具 备 原子 性 


代码 清单 13-4 _ Atomic 的 原子 自 


























的 过 程 ， 或 者 可 以 认为 是 无 条 件 内 联 进去 了 B]。 


启动 类 加 载 器 (Bootstrap ClassLoader) 加 载 的 Class 才 能 访问 它 ) ， 如 果 不 采 用 


























尼 ? 把 “race++” 操 作 或 increase() 方 法 





增 运 算 











了 Unsafe 类 的 CAS 操 作 。 




















CASs 操 作 来 避免 阻塞 同步 ， 代 码 如 上 一 章 的 代码 清单 12-1 所 示 。 我 们 曾经 通过 这 段 20 个 线程 自 增 10000 次 的 代码 来 证 明 volatile 变 量 不 
同步 块 包 衷 起 来 当然 是 一 个 办 法 ， 但 是 如 果 改 成 如 代码 清单 13-4 所 示 的 代码 ， 那 效率 将 会 提高 许多 。 








射手 段 ， 我 们 只 能 通过 其 他 
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* Atomic 变 量 自 增 运算 测试 
六 


* @author zzm 


WF 


public class AtomicTest { 
public static AtomicIinteger race = new AtomicInteger (0); 


public static void increase() 


race.incrementAndGet (); 


} 


{ 


Private static final int THREADS COUNT = 20; 
public static void main (String[] args) throws Exception { 
Thread[] threads = new Thread[THREADS COUNT]; 
for (int i = 0; i < THREADS COUNT; i++) { 
threads[i] = new Thread(new Runnable() { 
QOverride 
public void run() { 
for (int i = 0; i < 10000; i++) { 
increase (); 
} 
} 


Ds? 
threads [il] .start (); 

} 

while (Thread.activeCount() > 1) 
Thread.yield(); 

System.out .Println (race); 

} 
} 


运行 结果 如 下 : 





200000 














使 用 Atomiclnteger 代 蔡 int 后 ， 程 序 输出 了 正确 的 结果 ， 一 切 都 要 归功 于 incrementAndGet() 方 法 的 原子 性 。 它 的 实现 其 实 非 常 简单 ， 如 代码 清单 13-5 所 示 。 























代码 清单 13-5 incrementAndGet() 方 法 的 JDK 源 码 








/** 
* Atomically increment by one the current value. 
* @return the previous value 

/ 
public final int getandIncrement () { 
for (3) 1 
int current = get(); 
int next = current + 1; 
if (compareAndSet (current, next)) 
return current; 




















incrementAndGet() 方 法 在 一 个 无 限 循环 中 ， 不 断 烷 试 将 一 个 比 当前 值 大 1 的 新 值 赋值 给 自己 。 如 果 失 败 了 ， 那 说 明 在 执行 “获取 -设置 ”操作 的 时 候 值 已 经 有 了 修改 ， 于 是 再 次 循环 进行 下 一 次 操作 ， 
直到 设置 成 功 为 止 。 






































尽管 CAS 看 起 来 很 美 ， 但 显然 这 种 操作 无 法 涵盖 互 斥 同步 的 所 有 使 用 场景 ， 并 且 CAS 从 语义 上 来 说 并 不 是 完美 的 ， 存 在 这 样 的 一 个 逻辑 漏洞 : 如 果 一 个 变量 V 初 次 读 取 的 时 候 是 A 值 ， 并 且 在 准备 赋值 的 
时 候 检查 到 它 仍 然 为 A 值 ， 那 我 们 就 能 说 它 的 值 没有 被 其 他 线程 改变 过 了 吗 ? 如 果 在 这 段 期 间 它 的 值 曾经 被 改 成 了 B， 后 来 又 被 改 回 为 A， 那 CAS 操 作 就 会 误 认为 它 从 来 没有 被 改变 过 。 这 个 漏洞 称 为 CAS 操 
作 的 “ABA” 问 题 。J.U.C 包 为 了 解决 这 个 问题 ， 提 供 了 一 个 带 有 标记 的 原子 引用 类 “AtomicStampedReference”， 它 可 以 通过 控制 变量 值 的 版 本 来 保证 CAS 的 正确 性 。 不 过 目前 来 说 这 个 类 比较 鸡肋 ， 大 
部 分 情况 下 ABA 问 题 不 会 影响 程序 并 发 的 正确 性 ， 如 果 需 要 解决 ABA 问 题 ， 改 用 传统 的 互 斥 同步 可 能 会 比 原子 类 更 高 效 。 
























































3. 无 同步 方案 














要 保证 线程 安全 ， 并 不 是 一 定 就 要 进行 同步 ， 两 者 没有 因果 关系 。 同 步 只 是 保障 共享 数据 争 用 时 的 正确 性 的 手段 ， 如 果 一 个 方法 本 来 就 不 涉及 共享 数据 ， 那 它 自 然 就 无 须 任何 同步 措施 去 保证 正确 性 ， 
因此 会 有 一 些 代码 天 生 就 是 线程 安全 的 ， 笔 者 简单 介绍 其 中 的 两 类 。 















































可 重 入 代码 (Reentrant Code) : 这 种 代码 也 叫 纯 代 码 (Pure Code) ， 可 以 在 代码 执行 的 任何 时 刻 中 断 它 ， 转 而 去 执行 另外 一 段 代码 (包括 递归 调用 它 本 身 ) ， 而 在 控制 权 返 回 后 ， 原 来 的 程序 不 会 
出 现任 何 错误 。 相 对 线程 安全 来 说 ， 可 重 入 性 是 更 基本 的 特性 ， 它 可 以 保证 线程 安全 ， 即 所 有 的 可 重 入 的 代码 都 是 线程 安全 的 ， 但 是 并 非 所 有 的 线程 安全 的 代码 都 是 可 重 入 的 。 







































































可 重 入 代码 有 一 些 共同 的 特征 : 例如 不 依赖 存储 在 堆 上 的 数据 和 公用 的 系统 资源 、 用 到 的 状态 量 都 由 参数 中 传 入 、 不 调用 非 可 重 入 的 方法 等 。 我 们 可 以 通过 一 个 简单 一 些 的 原则 来 判断 代码 是 否 具 备 可 
重 入 性 : 如 果 一 个 方法 ， 它 的 返回 结果 是 可 以 预测 的 ， 只 要 输入 了 相同 的 数据 ， 就 都 能 返回 相同 的 结果 ， 那 它 就 满足 可 重 入 性 的 要 求 ， 当 然 也 就 是 线程 安全 的 。 




































































线程 本 地 存储 (Thread Local Storage) : 如 果 一 段 代码 中 所 需要 的 数据 必须 与 其 他 代码 共享 ， 那 就 看 看 这 些 共享 数据 的 代码 是 否 能 保证 在 同一 个 线程 中 执行 ?如 果 能 保证 ， 我 们 就 可 以 把 共享 数据 的 
可 见 范围 限制 在 同一 个 线程 之 内 ， 这 样 ， 无 须 同步 也 能 保证 线程 之 间 不 出 现 数据 争 用 的 问题 。 


















































符合 这 种 特点 的 应 用 并 不 少见 ， 大 部 分 使 用 消费 队列 的 架构 模式 (如 “生产 者 -消费 者 ”模式 ) 都 会 将 产品 的 消费 过 程 尽量 在 一 个 线程 中 消费 完 ， 其 中 最 重要 的 一 个 应 用 实例 就 是 经 典 Web 交 互 模型 中 
的 “一 个 请 求 对 应 一 个 服务 器 线程 ” (Thread-per-Request) 的 处 理 方式 ， 这 种 处 理 方式 的 广泛 应 用 使 得 Web 服 务 端的 很 多 应 用 都 可 以 使 用 线程 本 地 存储 来 解决 线程 安全 问题 。 










































































Java 语 言 中 ， 如 果 一 个 变量 要 被 多 线程 访问 ， 可 以 使 用 volatile 关 键 字 声明 它 为 “ 易 变 的 ”; 如 果 一 个 变量 要 被 某 个 线程 独 亭 ， 因 为 Java 中 没有 类 似 C++ 中 _declspectthread) 咎 这样 的 关键 字 ， 不 过 可 
以 通过 java.lang.ThreadLocal 类 来 实现 线程 本 地 存储 的 功能 。 每 一 个 线程 的 Thread 对 象 中 都 有 一 个 ThreadLocalMap 对 象 ， 这 个 对 象 存储 了 一 组 以 ThreadLocal.threadLocalHashCode 为 键 ， 以 本 地 线程 
变量 为 值 的 K-V 值 对 ，ThreadLocal 对 象 就 是 当前 线程 的 ThreadLocalMap 的 访问 入 口 ， 每 一 个 ThreadLocal 对 象 都 包含 了 一 个 独一无二 的 threadLocalHashCode 值 ， 使 用 这 个 值 就 可 以 在 线程 K-V 值 对 中 找 
回 对 应 的 本 地 线程 变量 。 
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[中 这 种 划分 方法 也 是 Brian Goetz 发 表 在 IBM developWorkers 上 的 一 篇 论文 中 提出 的 ， 这 里 写 “ 我 们 ”纯粹 是 笔者 下 笔 行文 中 的 语言 用 法 。 

[四 ”本 例 中 的 数据 及 图 片 来 源 于 Brian ” Goetz 为 IBM ”developerWorks ”撰写 的 论文 : 《Java theory and practice:More flexible,， scalable locking in JDK 5.0》， 原 文 地 址 是 : 
http://www.ibm.com/developerworks/java/library/j-jtp10264/?S_TACT=105AGX52&S_CMP=cn-a-j。 

B] 这 种 被 虚拟 机 特殊 处 理 的 方法 称 为 国有 函数 (Intrinsics) ， 类 似 的 国有 函数 还 有 Math.sin() 等 。 

团 在 Visual C++ 中 是 “_ declspec(thread)” 关 键 字 ， 在 GCC 中 是 “thread”。 


13.3” 锁 优化 





























高 效 并 发 是 JDK 1.6 的 一 个 重要 主题 ，HotSpot 虚 拟 机 开发 团队 在 这 个 版 本 上 花费 了 大 量 的 精力 去 实现 各 种 锁 优 化 技术 ， 如 适应 性 自 旋 (Adaptive Spinning) 、 锁 消除 (Lock Elimination) 、 锁 粗 化 
(Lock Coarsening) 、 轻 量 级 锁 (Lightweight Locking) 、 偏 向 锁 (Biased Locking) 等 ， 这 些 技术 都 是 为 了 在 线程 之 间 更 高 效 地 共享 数据 ， 以 及 解决 竞争 问题 ， 从 而 提高 程序 的 执行 效率 。 





























13.3.1 ” 自 旋 锁 与 自 适应 自 旋 


前 面 我 们 讨论 互 斥 同步 的 时 候 ， 提 到 了 互 斥 同步 对 性 能 最 大 的 影响 是 阻塞 的 实现 ， 挂 起 线程 和 恢复 线程 的 操作 都 需要 转 入 内 核 态 中 完成 ， 这 些 操作 给 系统 的 并 发 性 能 带 来 了 很 大 的 压力 。 同 时 ， 虚 拟 机 
的 开发 团队 也 注意 到 在 许多 应 用 上 ， 共 享 数据 的 锁定 状态 只 会 持续 很 短 的 一 段 时 间 ， 为 了 这 段 时 间 去 挂 起 和 恢复 线程 并 不 值得 。 如 果 物 理 机 器 有 一 个 以 上 的 处 理 器 ， 能 让 两 个 或 以 上 的 线程 同时 并 行 执行 ， 
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我 们 就 可 以 让 后 面 请 求 锁 的 那个 线程 “ 稍 等 一 会 儿 ”， 但 不 放弃 处 理 器 的 执行 时 间 ， 看 看 持 有 锁 的 线程 是 否 很 快 就 会 释放 锁 。 为 了 让 线程 等 待 ， 我 们 只 须 让 线程 执行 一 个 忙 循 环 ( 自 旋 ) ， 这 项 技术 就 是 所 
谓 的 自 旋 锁 。 

































































自 旋 锁 在 JDK 1.4.2 中 就 已 经 引入 ， 只 不 过 默认 是 关闭 的 ， 可 以 使 用 -XX: +UseSpinning 参 数 来 开启 ， 在 JDK 1.6 中 就 已 经 改 为 默认 开启 了 。 自 旋 等 待 不 能 代 蔡 阻塞 ， 且 先 不 说 对 处 理 器 数量 的 要 求 ， 
旋 等 待 本 身 虽 然 避免 了 线程 切换 的 开销 ， 但 它 是 要 占用 处 理 器 时 间 的 ， 所 以 如 果 锁 被 占用 的 时 间 很 短 ， 自 旋 等 待 的 效果 就 会 非常 好 ， 反 之 如 果 锁 被 占用 的 时 间 很 长 ， 那 么 自 旋 的 线程 只 会 白白 消耗 处 理 器 资 
源 ， 而 不 会 做 任何 有 用 的 工作 ， 反 而 会 带 来 性 能 的 浪费 。 因 此 自 旋 等 待 的 时 间 必 须要 有 一 定 的 限度 ， 如 果 自 旋 超 过 了 限定 的 次 数 仍然 没有 成 功 获得 锁 ， 就 应 当 使 用 传统 的 方式 去 挂 起 线程 了 。 自 旋 次 数 的 默 
认 值 是 10 次 ， 用 户 可 以 使 用 参数 -XX: PreBlockSpin 来 更 改 。 
































































































































































































































在 JDK 1.6 中 引入 了 自 适 应 的 自 旋 锁 。 自 适应 意味 着 自 旋 的 时 间 不 再 固定 了 ， 而 是 由 前 一 次 在 同一 个 锁 上 的 自 旋 时 间 及 锁 的 拥有 者 的 状态 来 决定 。 如 果 在 同一 个 锁 对 象 上 ， 自 旋 等 待 刚 刚 成 功 获得 过 锁 ， 
并 且 持 有 锁 的 线程 正在 运行 中 ， 那 么 虚拟 机 就 会 认为 这 次 自 旋 也 很 有 可 能 再 次 成 功 ， 进 而 它 将 允许 自 旋 等 待 持续 相对 更 长 的 时 间 ， 比 如 100 个 循环 。 另 一 方面 ， 如 果 对 于 某 个 锁 ， 自 旋 很 少 成 功 获得 过 ， 那 
在 以 后 要 获取 这 个 锁 时 将 可 能 省 略 掉 自 旋 过 程 ， 以 避免 浪费 处 理 器 资源 。 有 了 自 适应 自 旋 ， 随 着 程序 运行 和 性 能 监控 信息 的 不 断 完善 。 虚 拟 机 对 程序 锁 的 状况 预测 就 会 越 来 越 准确 ， 虚 拟 机 就 会 变 得 越 来 
越 “ 聪 明 ” 了 。 

































































13.3.2” 锁 消除 








锁 消除 是 指 虚拟 机 即时 编译 器 在 运行 时 ， 对 一 些 代码 上 要 求 同 步 ， 但 是 被 检测 到 不 可 能 存在 共享 数据 竞争 的 锁 进行 消除 。 锁 消除 的 主要 判定 依据 来 源 于 逃逸 分 析 的 数据 支持 (第 11 章 已 经 讲解 过 逃逸 分 
析 技 术 ) ， 如 果 判 断 到 一 段 代 码 中 ， 在 堆 上 的 所 有 数据 都 不 会 逃逸 出 去 被 其 他 线程 访问 到 ， 那 就 可 以 把 它们 当做 栈 上 数据 对 待 ， 认 为 它们 是 线程 私有 的 ， 同 步 加 锁 自然 就 无 须 进 行 。 












































也 许 读者 会 有 疑问 ， 变 量 是 否 逃 逸 ， 对 于 虚拟 机 来 说 需 要 使 用 数据 流 分 析 来 确定 ， 但 是 程序 员 自 己 应 该 是 很 清楚 的 ， 怎 么 会 在 明知 道 不 存在 数据 争 用 的 情况 下 要 求 同 步 呢 ? 答案 是 有 许多 同步 措施 并 不 
是 程序 员 自 己 加 入 的 ， 同 步 的 代码 在 Java 程 序 中 的 普遍 程度 也 许 超 过 了 大 部 分 读者 的 想象 。 我 们 来 看 看 下 面 代码 清单 13-6 中 的 例子 ， 这 段 非常 简单 的 代码 仅仅 是 输出 三 个 字符 串 相 加 的 结果 ， 无 论 是 源码 字 
面 上 还 是 程序 语义 上 都 没有 同步 。 









































代码 清单 13-6 一 段 看 起 来 没有 同步 的 代码 


public String concatString (String sl, String s2, String s3) { 
return sl + s2 + s3; 


} 




















我 们 也 知道 ， 由 于 String 是 一 个 不 可 变 的 类 ， 对 字符 串 的 连接 操作 总 是 通过 生成 新 的 String 对 象 来 进行 的 ， 因 此 Javac 编 译 器 会 对 String 连 接 做 自动 优化 。 在 JDK 1.5 之 前 ,会 转化 为 StringBuffer 对 象 的 
连续 append0 操 作 ， 在 JDK 1.5 及 以 后 的 版 本 中 ， 会 转化 为 StringBuilder 对 象 的 连续 append0 操 作 。 即 代码 清单 13-6 中 的 代码 可 能 会 变 成 代码 清单 13-7 的 样子 [1]。 























代码 清单 13-7 Javac 转 化 后 的 字符 串 连 接 操 作 








public String concatString (String sl, String s2, String s3) { 
StringBuffer sb = new StringBuffer(); 
sb.append (s1); 
sb.append (s2); 
sb.append (s3); 
return sb.toString(); 




















现在 大 家 还 认为 这 段 代码 没有 涉及 同步 吗 ? 每 个 StringBuffer.append0) 方 法 中 都 有 一 个 同步 块 ， 锁 就 是 sb 对 象 。 虚 拟 机 观察 变量 sb， 很 快 就 会 发 现 它 的 动态 作用 域 被 限制 在 concatString0 方 法 的 内 
部 。 也 就 是 sb 的 所 有 引用 永远 不 会 “逃逸 ”到 concatString() 方 法 之 外 ， 其 他 线程 无 法 访问 到 它 ， 所 以 这 里 虽然 有 锁 ， 但 是 可 以 被 安全 地 消除 掉 ， 在 即时 编译 之 后 ， 这 段 代码 就 会 忽略 掉 所 有 的 同步 而 直接 
执行 了 。 












































13.3.3 ” 锁 粗 化 























原则 上 ， 我 们 在 编写 代码 的 时 候 ， 总 是 推荐 将 同步 块 的 作用 范围 限制 得 尽量 小 
待 锁 的 线程 也 能 尽快 地 拿 到 锁 。 

















只 在 共享 数据 的 实际 作用 域 中 才 进 行 同 步 ， 这 样 是 为 了 使 得 需要 同步 的 操作 数量 尽 可 能 变 小 ， 如 果 存 在 锁 竞争 ， 那 等 


























大 部 分 情况 下 ， 上 面 的 原则 都 是 正确 的 ， 但 是 如 果 一 系列 的 连续 操作 都 对 同一 个 对 象 反 复 加 锁 和 解锁 ， 甚 至 加 锁 操 作 是 出 现在 循环 体 中 的 ， 那 即使 没有 线程 竞争 ， 频 繁 地 进行 互 斥 同步 操作 也 会 导致 不 
必要 的 性 能 损耗 。 














代码 清单 13-7 中 连续 的 append() 方 法 就 属于 这 类 情况 。 如 果 虚 拟 机 探测 到 有 这 样 一 串 和 零碎 的 操作 都 对 同一 个 对 象 加 锁 ， 将 会 把 加 锁 同 步 的 范围 扩展 ( 粗 化 ) 到 整个 操作 序列 的 外 部 ， 以 代码 清单 13-7 为 
例 ， 就 是 扩展 到 第 一 个 append0 操 作 之 前 直至 最 后 一 个 append( 操 作 之 后 ， 这 样 只 需要 加 锁 一 次 就 可 以 了 。 
























































13.3.4” 轻 量 级 锁 


轻 量 级 锁 是 JDK 1.6 中 加 入 的 新 型 锁 机 制 ， 它 名 字 中 的 “ 轻 量 级 ”是 相对 于 使 用 操作 系统 互 斥 量 来 实现 的 传统 锁 而 言 的 ， 因 此 传统 的 锁 机 制 就 被 称 为 “重量 级 ” 锁 。 首 先 需要 强调 一 点 的 是 ， 轻 量 级 锁 并 
不 是 用 来 代 蔡 重量 级 锁 的 ， 它 的 本 意 是 在 没有 多 线程 竞争 的 前 提 下 ， 减 少 传统 的 重量 级 锁 使 用 操作 系统 互 斥 量 产生 的 性 能 消耗 。 










































































要 理解 轻 量 级 锁 ， 以 及 后 面 会 讲 到 的 偏向 锁 的 原理 和 运作 过 程 ， 必 须 从 HotSpot 虚 拟 机 的 对 象 对象 头 部 分 ) 的 内 存 布局 开始 介绍 。Hotspot 虚 拟 机 的 对 象 头 (Object Header) 分 为 两 部 分 信息 ， 第 
一 部 分 用 于 存储 对 象 自身 的 运行 时 数据 ， 如 哈 希 码 (HashCode) 、GC 分 代 年 龄 (Generational GC Age) 等 ， 这 部 分 数据 的 长 度 在 32 位 和 64 位 的 虚拟 机 中 分 别 为 32 个 和 64 个 Bits， 官 方 称 它 为 “Mark 
Word”， 它 是 实现 轻 量 级 锁 和 偏向 锁 的 关键 。 另 外 一 部 分 用 于 存储 指向 方法 区 对 象 类 型 数据 的 指针 ， 如 果 是 数组 对 象 的 话 ， 还 会 有 一 个 额外 的 部 分 用 于 存储 数组 长 度 。 










































































对 象 头 信息 是 与 对 象 自身 定义 的 数据 无 关 的 额外 存储 成 本 ， 考 虑 到 虚拟 机 的 空间 效率 ，Mark Word 被 设计 成 一 个 非 固定 的 数据 结构 以 便 在 极 小 的 空间 内 存储 尽量 多 的 信息 ， 它 会 根据 对 象 的 状态 复 用 自 
己 的 存储 空间 。 例 如 在 32 位 的 Hotspot 虚 拟 机 中 对 象 未 被 锁定 的 状态 下 ，Mark Word 的 32 个 Bits 空 间 中 的 25Bits 用 于 存储 对 象 哈 希 码 (HashCode) ，4Bits 用 于 存储 对 象 分 代 年 龄 ，2Bits 用 于 存储 锁 标志 
位 ，1Bit 固 定 为 0， 在 其 他 状态 ( 轻 量 级 锁定 、 重 量 级 锁定 、GC 标 记 、 可 偏向 ) 下 对 象 的 存储 内 容 如 表 13-1 所 示 。 











































































































表 13-1 HotSpot 庶 拟 机 对 象 头 Matk Word 





存储 内 容 标志 位 状 态 
对 象 哈 希 码 、 对 象 分 代 年 龄 01 未 锁定 
指向 锁 记 录 的 指针 00 量 级 锁定 
指向 重量 级 锁 的 指针 10 膨胀 (重量 级 锁定 ) 
不 需要 记录 信息 11 GC 标记 
偏向 线程 DD、 偏 向 时 间 惟 、 对 象 分 代 年 龄 01 可 偏向 








简单 地 介绍 完了 对 象 的 内 存 布局 ， 我 们 把 话题 返回 到 轻 量 级 锁 的 执行 过 程 上 。 在 代码 进入 同步 块 的 时 候 ， 如 果 此 同步 对 象 没有 被 锁定 ( 锁 标志 位 为 “01” 状 态 ) ， 虚 拟 机 首先 将 在 当前 线程 的 栈 帧 中 建 
立 一 个 名 为 锁 记 录 (Lock Record) 的 空间 ， 用 于 存储 锁 对 象 目前 的 Mark Word 的 拷贝 (官方 把 这 份 拷贝 加 了 一 个 Displaced 前 缀 ， 即 Displaced Mark Word) ， 这 时 候 线程 堆栈 与 对 象 头 的 状态 如 图 13-3 
所 示 。 





















































然后 ， 虚 拟 机 将 使 用 CAs 操 作 尝试 将 对 象 的 Mark Word 更 新 为 指向 Lock Record 的 指针 。 如 果 这 个 更 新 动作 成 功 了 ， 那 么 这 个 线程 就 拥有 了 该 对 象 的 锁 ， 并 且 对 象 Mark Word 的 锁 标 志 位 (Mark 
Word 的 最 后 两 个 Bits) 将 转变 为 “00”， 即 表示 此 对 象 处 于 轻 量 级 锁定 的 状态 ， 这 时 候 线程 堆栈 与 对 象 头 的 状态 如 图 13-4 所 示 。 
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13-3” 轻 量 级 锁 CAS 操 作 之 前 堆栈 与 对 象 的 状态 由 
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图 13-4 ” 轻 量 级 锁 CAS 操 作 之 后 堆栈 与 对 象 的 状态 











如 果 这 个 更 新 操作 失败 了 ， 虚 拟 机 首先 会 检查 对 象 的 Mark Word 是 否 指向 当前 线程 的 栈 帧 ， 如 果 是 就 说 明 当 前 线程 已 经 拥有 了 这 个 对 象 的 锁 ， 可 以 直接 进入 同步 块 继续 执行 ， 否 则 说 明 这 个 锁 对 象 已 经 
被 其 他 线程 抢占 了 。 如 果 有 两 条 以 上 的 线程 争 用 同一 个 锁 ， 那 轻 量 级 锁 就 不 再 有 效 ， 要 膨胀 为 重量 级 锁 ， 锁 标志 的 状态 值 变 为 “10”，Mark Word 中 存储 的 就 是 指向 重量 级 锁 ( 互 斥 量 ) 的 指针 ， 后 面 等 待 
锁 的 线程 也 要 进入 阻塞 状态 。 



































上 面 描述 的 是 轻 量 级 锁 的 加 锁 过 程 ， 它 的 解锁 过 程 也 是 通过 CAS 操 作 来 进行 的 ， 如 果 对 象 的 Mark Word 仍 然 指 向 着 线程 的 锁 记 录 ， 那 就 用 CAS 操 作 把 对 象 当前 的 Mark Word 和 线程 中 复制 的 Displaced 
Mark Word 蔡 换 回 来 ， 如 果 蔡 换 成 功 ， 整 个 同步 过 程 就 完成 了 。 如 果 蔡 换 失败 ， 说 明 有 其 他 线程 尝试 过 获取 该 锁 ， 那 就 要 在 释放 锁 的 同时 ， 唤 醒 被 挂 起 的 线程 。 





















































轻 量 级 锁 能 提升 程序 同步 性 能 的 依据 是 “对 于 绝 大 部 分 的 锁 ， 在 整个 同步 周期 内 都 是 不 存在 竞争 的 ”， 这 是 一 个 经 验 数据 。 如 果 没有 竞争 ， 轻 量 级 锁 使 用 CAs 操 作 避 免 了 使 用 互 斥 量 的 开销 ， 但 如 果 存 
在 锁 竞 争 ， 除 了 互 斥 量 的 开销 外 ， 还 额外 发 生 了 CAS 操 作 ， 因 此 在 有 竞争 的 情况 下 ， 轻 量 级 锁 会 比 传统 的 重量 级 锁 更 慢 。 

















13.3.5 “偏向 锁 


























偏向 锁 也 是 JDK 1.6 中 引入 的 一 项 锁 优 化 ， 它 的 目的 是 消除 数据 在 无 竞争 情况 下 的 同步 原 语 ， 进 一 步 提高 程序 的 运行 性 能 。 如 果 说 轻 量 级 锁 是 在 无 竞争 的 情况 下 使 用 CAS 操 作 去 消除 同步 使 用 的 互 斥 量 ， 
那 偏向 锁 就 是 在 无 竞争 的 情况 下 把 整个 同步 都 消除 掉 ， 连 CAs 操 作 都 不 做 了 。 








偏向 锁 的 “ 偏 ”， 就 是 偏心 的 “ 偏 ”、 偏 祖 的 “ 偏 ”。 它 的 意思 是 这 个 锁 会 偏向 于 第 一 个 获得 它 的 线程 ， 如 果 在 接 下 来 的 执行 过 程 中 ， 该 锁 没 有 被 其 他 的 线程 获取 ， 则 持 有 偏向 锁 的 线程 将 永远 不 需要 
再 进行 同步 。 








如 果 读 者 读 懂 了 前 面 轻 量 级 锁 中 关于 对 象 头 Mark Word 与 线程 之 间 的 操作 过 程 ， 那 偏向 锁 的 原理 理解 起 来 就 会 很 简单 。 假 设 当前 虚拟 机 启用 了 偏向 锁 (启用 参数 -XX: +UseBiasedLocking， 这 是 JDK 
1.6 的 默认 值 ) ， 那 么 ， 当 锁 对 象 第 一 次 被 线程 获取 的 时 候 ， 虚 拟 机 将 会 把 对 象 头 中 的 标志 位 设 为 “01” ， 即 偏向 模式 。 同 时 使 用 CAS 操 作 把 获取 到 这 个 锁 的 线程 的 ID 记录 在 对 象 的 Mark Word 之 中 ， 如 果 
CAS 操 作成 功 ， 持 有 偏向 锁 的 线程 以 后 每 次 进入 这 个 锁 相关 的 同步 块 时 ， 虚 拟 机 都 可 以 不 再 进行 任何 同步 操作 (例如 Locking、Unlocking 及 对 Mark Word 的 Update 等 ) 。 























当 有 另外 一 个 线程 去 尝试 获取 这 个 锁 时 ， 偏 向 模式 就 宣告 结束 。 根 据 锁 对 象 目前 是 否 处 于 被 锁定 的 状态 ， 撤 销 偏向 (Revoke Bias) 后 恢复 到 未 锁定 (标志 位 为 “01”) 或 轻 量 级 锁定 (标志 位 
为 “00”) 的 状态 ， 后 续 的 同步 操作 就 如 上 面 介 绍 的 轻 量 级 锁 那 样 执行 。 偏 向 锁 、 轻 量 级 锁 的 状态 转化 及 对 象 Mark Word 的 关系 如 图 13-5 所 示 。 




















偏向 锁 可 以 提高 带 有 同步 但 无 竞争 的 程序 性 能 。 它 同样 是 一 个 带 有 效益 权衡 (Trade Off) 性 质 的 优化 ， 也 就 是 说 它 并 不 一 定 总 是 对 程序 运行 有 利 ， 如 果 程 序 中 大 多 数 的 锁 都 总 是 被 多 个 不 同 的 线程 访 
问 ， 那 偏向 模式 就 是 多 余 的 。 在 具体 问题 具体 分 析 的 前 提 下 ， 有 时 候 使 用 参数 -XX: -UseBiasedLocking 来 禁止 偏向 锁 优 化 反而 可 以 提升 性 能 。 





























分 配对 象 









如 果 偏 向 锁 可 用 


| 0 |epoch| age |1|01] 


未 锁定 、 未 偏向 但 是 可 偏向 的 对 稍 


如 果 偏 向 鳞 不 可 用 


| hashcode | age |0|o1 


未 被 锁定 的 ， 不 可 坑 向 对 象 


ite | 人 描 销 偏向 轻 量 级 锁定 递归 锁定 
一 并 


thread ID | 守 l pointertolock record | 
thread ID epoch | age |1|01| 如 果 对 旬 已 山 定 pointerto lock record 00| 


已 偏向 的 、 负 定 或 未 锁定 的 对 旬 读 径 量 级 锁定 的 对 和 
4 脱 了 有 


一 一 
锁定 / 解锁 
pointer to heavyweight monitor 10| 
Ce | 
被 重量 级 锁定 的 对 象 
13-5 偏向 锁 、 轻 量 级 锁 的 状态 转化 及 对 象 Mark Word 的 关系 
四 实事 求 是 地 说 ， 了 既然 谈 到 锁 消 除 与 逃 选 分 析 ， 那 虚拟 机 就 不 可 能 是 JDK 1.5 之 前 的 版 本 ， 所 以 实际 上 会 转化 为 非 线 程 安全 的 StringBuilder 来 完成 字符 串 拼 接 ， 而 不 会 加 锁 。 但 是 这 也 不 影响 笔者 用 这 个 例子 
来 证 明 Java 对 象 中 同步 的 普遍 性 。 
D] 图 13-3 和 图 13-4 来 源 于 HotSpot 虚拟 机 的 一 位 Senior Staff Engineer 一 一 Paul Hohensee 所 写 的 PPT “The Hotspot Java Virtual Machine” 。 





如 果 对 象 未 锁定 






解 钻 














13.4 ”本章 小 结 





本 章 介 绍 了 线程 安全 所 涉及 的 概念 和 分 类 、 同 步 实现 的 方式 及 虚拟 机 的 底层 运作 原理 ， 并 且 介绍 了 虚拟 机 实现 高 效 并 发 所 做 的 一 系列 锁 优化 措施 。 





许多 老 程序 员 都 说 过 ， 能 够 写 出 高 伸缩 性 的 并 发 程序 是 一 门 艺 术 ， 而 了 解 并 发 在 系统 底层 是 如 何 实现 的 ， 则 是 掌握 这 门 艺术 的 前 提 条 件 ， 也 是 成 长 为 高 级 程序 员 的 必 备 知识 之 一 。 


附录 A_ Java 虚拟 机 家 族 


A.1 商用 高 性 能 虚拟 机 


"Sun HotSpot 














应 用 最 为 广泛 的 java 虚拟 机 ， 本 书 就 是 以 这 个 虚拟 机 为 平台 进行 讲解 的 。 它 最 初 由 一 家 名 为 “Longview Technologies” 的 小 公司 开发 ， 因 为 HotSpot 的 优异 表现 ， 这 家 公司 在 1997 年 被 Sun 公 司 收购 
了 。Hotspot 虚 拟 机 发 布 时 是 作为 Sun JDK 1.2 的 附加 程序 提供 的 ， 后 来 它 成 为 了 Sun JDK 1.3 及 之 后 所 有 版 本 的 Sun JDK 的 默认 虚拟 机 。 











”BEA JRockit 














JRockit 虚 拟 机 是 BEA 公 司 于 2002 年 从 Appeal Virtual Machines 收 购 获得 的 虚拟 机 。 它 是 一 款 面 向 服务 器 硬件 和 服务 端 使 用 场景 高 度 优化 过 的 虚拟 机 ， 曾 经 号 称 是 “世界 上 速度 最 快 的 虚拟 机 ”。 由 了 
专注 于 服务 端 应 用 ， 它 的 内 部 不 包含 解析 器 的 实现 ， 全 部 代码 都 靠 即 时 编译 器 编译 后 执行 。 





























: IBMJ9 








J9 庶 拟 机 是 IBM 公 司 单独 开发 的 高 性 能 虚拟 机 ， 它 并 不 独立 出 售 ， 而 是 作为 IBM 公 司 各 种 产品 的 执行 平台 ，IBM 把 它 定义 为 一 个 可 以 适应 从 嵌入 式 设备 到 大 型 企业 级 应 用 的 、 高 可 移植 性 的 Java 运 行 平 


和 
口 。 











A.2 ”其 他 影响 较 大 的 虚拟 机 


“ Sun Classic 虚 拟 机 





以 现在 的 眼光 来 看 ， 这 个 虚拟 机 很 原始 ， 几 乎 是 实验 室 研究 的 作品 。 但 它 意 义 重 大 ， 是 在 JDK 1.0 时 代 使 用 的 Java 虚 拟 机 ， 是 各 种 虚拟 机 的 始祖 。 它 的 内 部 不 存在 即时 编译 器 ， 只 能 使 用 纯 解释 的 方式 运 
行 ， 如 果 要 使 用 IT， 必须 通过 外 挂 的 方式 插入 额外 的 即时 编译 器 (如 Symantec 川 编 译 器 ) ， 但 插入 后 解释 器 就 不 再 工作 了 。 

















' Sun Exact 虚 拟 机 


这 是 Sun 公 司 在 HotSpot 之 外 的 另 一 个 Java 虚 拟 机 ， 在 JDK 1.2 时 代 曾 短暂 地 投入 过 商用 ， 它 与 HotSpot 在 同时 期 开发 ， 但 最 终 被 HotSpot 所 取代 。 在 它 身上 已 经 可 以 看 见 日 后 Sun 虚 拟 机 的 模糊 轮廓 ， 
如 两 级 即时 编译 器 、 编 译 器 与 解释 器 混合 工作 模式 、 多 层 编译 等 。 











“ Apache Harmony 虚 拟 机 


Harmony 是 Apache 软 件 基金 会 主导 的 、 开 源 的 、 独 立 的 、 实 际 兼 容 于 JDK 1.5 和 JDK 1.6 的 虚拟 机 实现 ， 它 虽然 不 像 前 面 两 款 虚拟 机 那样 是 Java 混 沌 初生 时 开 疆 拓 土 的 功臣 ， 但 论 影响 力 一 点 也 不 逊 
色 : 它 间接 催生 了 Google Android 平 台 的 Dalvik 虚 拟 机 ，Android 的 影响 力 日 益 庞大 ， 目 前 已 是 最 成 功 的 数码 设备 通用 平台 ; 由 于 它 的 TCK 授 权 问 题 ， 直 接 导致 Apache 与 Oracle 的 决裂 ， 从 而 退出 了 JCP 组 





















































织 ， 这 是 近代 Java 阵 营 遇 到 的 最 严重 的 分 裂 危机 。 





A.3 ”嵌入 式 庶 拟 机 
“ Dalv 还 虚拟 机 


Dalvik 虚 拟 机 是 Google 等 厂商 合作 开发 的 Android 移 动 设备 平台 的 核心 组 成 部 分 之 一 ， 它 的 名 字 来 源 于 冰岛 一 个 名 为 Dalvik 的 小 渔村 。Dalvik 并 不 是 一 个 Java 虚 拟 机 ， 它 执行 dex (Dalvik 
Executable) 文件 而 不 是 class 文 件 ， 使 用 寄存 器 架构 而 不 是 栈 架构 。 但 是 它 的 开发 体系 与 java 有 着 干 丝 万 缕 的 关系 : 可 以 直接 使 用 大 部 分 的 Java API、dex 文 件 可 以 直接 从 class 文 件 转化 而 来 。 目 前 此 虚拟 
机 随 着 Android 一 起 处 于 迅猛 发 展 的 阶段 ， 在 Android 2.2 中 提供 了 即时 编译 器 的 实现 ， 执 行 性 能 有 了 很 大 的 提高 。 























"KVM 虚拟 机 




















KVM 中 的 K 是 “kKilobyte” 的 意思 ， 它 强调 简单 、 轻 量 、 高 度 可 移植 ， 但 是 运行 速度 比较 慢 。 在 Android、iOS 等 智能 手机 操作 系统 出 现 之 前 ， 曾 广泛 应 用 于 手机 平台 。 











" CDC/CLDC HotSpot 虚 拟 机 





也 称 为 phoneME Advanced/Feature 庶 拟 机 ，CDC 和 CLDC HotSpot 分 别 是 Sun 针 对 高 端 嵌 入 式 设备 和 中 低 端 嵌入 式 设备 的 虚拟 机 ， 用 来 代替 KVM。 

















A4 其 他 虚拟 机 实现 


* JavalnJava: http://labs.oracle.com/kanban/JavalnjJava.html 

* Maxine: http://research.sun.com/projects/maxine/ 

* JamVM: http://jamvm.sourceforge.net/ 

* cacaovm: http://www.cacaovm.org/ 

* SableVM: http://www.sablevm.org/ 

* Kaffe: http://www.kaffe.org/ 

* Jelatine JVM: http://jelatine.sourceforge.net/ 

* NanoVM: http://www.harbaum.org/till/nanovm/index.shtml 
* MRP: http://mrp.codehaus.org/ 

* Moxie JVM: http://moxie.sourceforge.net/ 


“ Jikes RVM: http://jikesrvm.org/ 


附录 B ”虚拟 机 字 节 码 指令 


字 节 码 助 记 符 指令 含义 


0x00 nop 什么 都 不 做 

0x01 aconst null 将 null 推送 至 栈 顶 

0x02 iconst ml 将 int 型 -1 推送 至 栈 顶 

0x03 iconst 0 将 int 型 0 推送 至 栈 顶 

0x04 iconst 1 将 int 型 1 推送 至 栈 顶 

0x05 iconst 2 将 int 型 2 推送 至 栈 顶 

0x06 iconst 3 将 int 型 3 推送 至 栈 顶 

0x07 iconst 4 将 int 型 4 推送 至 栈 顶 

0x08 iconst 5 将 int 型 5 推送 至 栈 顶 

0x09 lconst 0 将 long 型 0 推送 至 栈 顶 

0x0a lconst 1 将 long 型 1 推送 至 栈 顶 

0x0b fconst 0 将 float 型 0 推送 至 栈 顶 

0x0c fconst 1 将 float 型 1 推送 至 栈 顶 

0x0d fconst 2 将 float 型 2 推送 至 栈 顶 

0x0e dconst 0 将 double 型 0 推送 至 栈 顶 

OxOf dconst 1 将 double 型 1 pb 

0x10 bipush 将 单字 节 量 值 (128~127) 推送 至 栈 顶 

0x11 sipush Eees 常量 值 (32768~32767) 推送 至 栈 顶 
0x12 ldc 将 int、float 或 String 型 常量 值 从 常量 池 中 推送 至 栈 顶 
0x13 ldc_w 将 int、foat 或 String 型 常量 值 从 常量 池 中 推送 至 栈 顶 〈 宽 索引 ) 
0x14 ldc2_w 将 long 或 double 型 常量 值 从 常量 地 中 推送 至 栈 顶 〈 宽 索引 ) 
0x15 iload 将 指定 的 int 型 本 地 变量 推送 至 栈 顶 

0x16 lload 将 指定 的 long 型 本 地 变量 推送 至 栈 顶 

0x17 fload 将 指定 的 float 型 本 地 变量 推送 至 栈 顶 

0x18 dload 将 指定 的 double 型 本 地 变量 推送 至 栈 顶 

0x19 aload 将 指定 的 引用 类 型 本 地 变量 推送 至 栈 顶 

0xla iload 0 将 第 一 个 int 型 本 地 变量 推送 至 栈 顶 

0xlb iload 1 将 第 二 个 int 型 本 地 变量 推送 至 栈 顶 

0xlc iload 2 将 第 三 个 int 型 本 地 变量 推送 至 栈 顶 

Oxld iload 3 将 第 四 个 int 型 本 地 变量 推送 至 栈 顶 

0xle lload 0 将 第 一 个 long 型 本 地 变量 推送 至 栈 


Ox1f lload 1 将 第 二 个 long 型 本 地 变量 推送 至 栈 





字 节 码 助 记 符 引 令 含义 
0x20 lload 2 将 第 三 个 long 型 本 地 变量 推送 至 栈 顶 
0x21 lload_3 将 第 四 个 long 型 本 地 变量 推送 至 栈 顶 
0x22 fload 0 将 第 一 个 float 型 本 地 变量 推送 至 栈 顶 
Ox23 fload_1 将 第 二 个 float 型 本 地 变量 推送 至 栈 顶 
Ox24 fload 2 将 第 三 个 float 型 本 地 变量 推送 至 栈 顶 
0x25 fload 3 将 第 四 个 float 型 本 地 变量 推送 至 栈 顶 
0x26 dload_ 0 将 第 一 个 double 型 本 地 变量 推送 至 栈 顶 
0x27 dload 1 将 第 二 个 double 型 本 地 变量 推送 至 栈 顶 
Ox28 dload 2 将 第 三 个 double 型 本 地 变量 推送 至 栈 顶 
0x29 dload 3 将 第 四 个 double 型 本 地 变量 推送 至 栈 顶 
0x2a aload 0 将 第 一 个 引用 类 型 本 地 变量 推送 至 栈 顶 
Ox2b aload 1 将 第 二 个 引用 类 型 本 地 变量 推送 至 栈 顶 
Ox2c aload 2 将 第 三 个 引用 类 型 本 地 变量 推送 至 栈 顶 
Ox2d aload 3 将 第 四 个 引用 类 型 本 地 变量 推送 至 栈 顶 
Ox2e iaload 将 int 型 数组 指定 索引 的 值 推送 至 栈 顶 
Ox2f laload 将 long 型 数组 指定 索引 的 值 推送 至 栈 顶 
Ox30 faload 将 float 型 数组 指定 索引 的 值 推送 至 栈 顶 
Ox31 daload 将 double 型 数组 指定 索引 的 值 推送 至 栈 顶 
0x32 aaload 将 引用 型 数组 指定 索引 的 值 推送 至 栈 顶 
Ox33 baload 将 boolean 或 byte 型 数组 指定 索引 的 值 推送 至 栈 顶 
Ox34 caload 将 char 型 数组 指定 索引 的 值 推送 至 栈 顶 
Ox35 saload 将 short 型 数组 指定 索引 的 值 推送 至 栈 顶 
0x36 istore 将 栈 顶 int 型 数值 存 入 指定 本 地 变量 
0x37 lstore 将 栈 顶 long 型 数值 存 入 指定 本 地 变量 
Ox38 fstore 将 栈 顶 float 型 数值 存 入 指定 本 地 变量 
0x39 dstore 将 栈 顶 double 型 数值 存 入 指定 本 地 变量 
Ox3a astore 将 栈 顶 引用 型 数值 存 入 指定 本 地 变量 
0x3b istore_0 将 栈 顶 int 型 数值 存 入 第 一 个 本 地 变量 
0x3c istore_1 将 栈 顶 int 型 数值 存 入 第 二 个 本 地 变量 
Ox3d istore_2 将 栈 顶 int 型 数值 存 入 第 三 个 本 地 变量 
Ox3e istore_3 将 栈 顶 int 型 数值 存 入 第 四 个 本 地 变量 
Ox3f lstore_0 将 栈 顶 long 型 数值 存 入 第 一 个 本 地 变量 
Ox40 lstore_1 将 栈 顶 long 型 数值 存 入 第 二 个 本 地 变量 
Ox41 lstore_2 将 栈 顶 long 型 数值 存 入 第 三 个 本 地 变量 
0x42 lstore_3 将 栈 顶 long 型 数值 存 和 第 四 个 本 地 变量 
Ox43 fstore 0 将 栈 顶 float 型 数值 存 入 第 一 个 本 地 变量 


Ox44 fstore 1 将 栈 顶 float 型 数值 存 入 第 二 个 本 地 变量 








字 节 码 助 记 符 指令 含义 

Ox45 fstore_2 将 栈 顶 float 型 数值 存 入 第 三 个 本 地 变量 

0x46 fstore 3 将 栈 顶 float 型 数值 存 入 第 四 个 本 地 变量 

0x47 dstore 0 将 栈 顶 double 型 数值 存 入 第 一 个 本 地 变量 

Ox48 dstore 1 将 栈 顶 double 型 数值 存 入 第 二 个 本 地 变量 

Ox49 dstore 2 将 栈 顶 double 型 数值 存 入 第 三 个 本 地 变量 

Ox4a dstore 3 将 栈 顶 double 型 数值 存 入 第 四 个 本 地 变量 

0x4b astore 0 将 栈 顶 引 用 型 数值 存 和 人 第 一 个 本 地 变量 

Ox4c astore_1 将 栈 顶 引用 型 数值 存 入 第 二 个 本 地 变量 

Ox4d astore 2 将 栈 顶 引用 型 数值 存 入 第 三 个 本 地 变量 

Ox4e astore 3 将 栈 顶 引用 型 数值 存 入 第 四 个 本 地 变量 

Ox4f iastore 将 栈 顶 int 型 数值 存 入 指定 数组 的 指定 索引 位 置 

Ox50 lastore 将 栈 顶 long 型 数值 存 入 指定 数组 的 指定 索引 位 置 

Ox51 fastore 将 栈 顶 float 型 数值 在 和 指定 数组 的 指定 索引 位 置 

Ox52 dastore 将 栈 顶 double 型 数值 存 入 指定 数组 的 指定 索引 位 置 

Ox53 aastore 将 栈 顶 引用 型 数值 存 入 指定 数组 的 指定 索引 位 置 

Ox54 bastore 将 栈 顶 boolean 或 byte 型 数值 存 入 指定 数组 的 指定 索引 位 置 

Ox55 castore 将 栈 顶 char 型 数值 存 入 指定 数组 的 指定 索引 位 置 

Ox56 sastore 将 栈 顶 short 型 数值 存 入 指定 数组 的 指定 索引 位 置 

0x57 pop 将 栈 顶 数值 弹出 《数值 不 能 是 long 或 double 类 型 的 ) 

Ox58 pop2 将 栈 顶 的 一 个 (对 于 long 或 double 类 型 ) 或 两 个 数值 (对 于 非 long 或 
double 的 其 他 类 型 ) 弹出 

Ox59 dup 复制 栈 顶 数值 并 将 复制 值 压 入 栈 顶 

Ox5a dup_xl 复制 栈 顶 数值 并 将 两 个 复制 值 压 入 栈 顶 

Ox5b dup_x2 复制 栈 顶 数值 并 将 三 个 《或 两 个 ) 复制 值 压 入 栈 顶 

Ox5c dup2 复制 栈 顶 一 个 (对 于 long 或 double 类 型 ) 或 两 个 (对 于 非 long 或 
double 的 其 他 类 型 ) 数值 并 将 复制 值 压 入 栈 顶 

Ox5d dup2 xl dup_x1 指令 的 双 倍 版 本 

Ox5e dup2 x2 dup_x2 指令 的 双 倍 版 本 

Ox5f swap 将 栈 最 顶端 的 两 个 数值 互 换 ( 数 值 不 能 是 long 或 double 类 型 ) 

0x60 iadd 将 栈 顶 两 int 型 数值 相 加 并 将 结果 压 入 栈 顶 

0x61 ladd 将 栈 顶 两 long 型 数值 相 加 并 将 结果 压 入 栈 顶 

0x62 fadd 将 栈 顶 两 oat 型 数值 相 加 并 将 结果 压 入 栈 顶 

0x63 dadd 将 栈 顶 两 double 型 数值 相 加 并 将 结果 压 入 栈 顶 

Ox64 isub 将 栈 顶 两 int 型 数值 相 减 并 将 结果 压 入 栈 顶 

Ox65 lsub 将 栈 顶 两 long 型 数值 相 减 并 将 结果 压 入 栈 顶 

0x66 fsub 将 栈 顶 两 float 型 数值 相 减 并 将 结果 压 入 栈 顶 


0x67 dsub 将 栈 顶 两 double 型 数值 相 减 并 将 结果 压 入 栈 顶 


指令 含义 
将 栈 顶 两 int 型 数值 相 乘 并 将 结果 压 人 栈 顶 
将 栈 顶 两 long 型 数值 相 乘 并 将 结果 压 人 栈 顶 
将 栈 顶 两 float 型 数值 相 乘 并 将 结果 压 入 栈 顶 
将 栈 顶 两 double 型 数值 相 乘 并 将 结果 压 入 栈 顶 
将 栈 顶 两 int 型 数值 相 除 并 将 结果 压 入 栈 顶 
将 栈 顶 两 long 型 数值 相 除 并 将 结果 压 入 栈 顶 
将 栈 顶 两 float 型 数值 相 除 并 将 结果 压 入 栈 顶 
将 栈 顶 两 double 型 数值 相 除 并 将 结果 压 入 栈 顶 
将 栈 顶 两 int 型 数值 作 取 模 运 算 并 将 结果 压 入 栈 顶 
将 栈 顶 两 long 型 数值 作 取 模 运 算 并 将 结果 压 入 栈 顶 
将 栈 顶 两 float 型 数值 作 取 模 运算 并 将 结果 压 入 栈 顶 
将 栈 顶 两 double 型 数值 作 取 模 运算 并 将 结果 压 人 栈 项 
将 栈 顶 int 型 数值 取 负 并 将 结果 压 入 栈 顶 
将 栈 顶 long 型 数值 取 负 并 将 结果 压 入 栈 顶 
将 栈 顶 float 型 数值 取 负 并 将 结果 压 入 栈 顶 
将 栈 顶 double 型 数值 取 负 并 将 结果 压 入 栈 顶 
将 int 型 数值 左 移 位 指定 位 数 并 将 结果 压 入 栈 顶 
将 long 型 数值 左 移 位 指定 位 数 并 将 结果 压 入 栈 顶 
将 int 型 数值 右 〈 带 符号 ) 移 位 指定 位 数 并 将 结果 压 入 栈 顶 
将 long 型 数值 右 〈 带 符号 ) 移 位 指定 位 数 并 将 结果 压 入 栈 顶 
将 int 型 数值 右 〈( 无 符号 ) 移 位 指定 位 数 并 将 结果 压 入 栈 顶 
将 long 型 数值 右 〈 无 符号 ) 移 位 指定 位 数 并 将 结果 压 入 栈 顶 
将 栈 顶 两 int 型 数值 作 “ 按 位 与 ”并 将 结果 压 入 栈 顶 
将 栈 顶 两 long 型 数值 作 “ 按 位 与 ”并 将 结果 压 入 栈 顶 
将 栈 顶 两 int 型 数值 作 “ 按 位 或 ”并 将 结果 压 入 栈 顶 
将 栈 顶 两 long 型 数值 作 “ 按 位 或 ”并 将 结果 压 入 栈 顶 
将 栈 顶 两 int 型 数值 作 “ 按 位 异 或 ”并 将 结果 压 入 栈 顶 
将 栈 顶 两 long 型 数值 作 “ 按 位 异 或 ”并 将 结果 压 入 栈 顶 
将 指定 int 型 变量 增加 指定 值 (如 it+、i--、i+=2 等 ) 
将 栈 顶 int 型 数值 强制 转换 成 long 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 int 型 数值 强制 转换 成 float 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 int 型 数值 强制 转换 成 double 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 long 型 数值 强制 转换 成 int 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 long 型 数值 强制 转换 成 float 型 数值 并 将 结果 压 入 栈 顶 





( 续 ) 


将 栈 顶 long 型 数值 强制 转换 成 double 型 数值 并 将 结果 压 入 栈 顶 


将 栈 顶 float 型 数值 强制 转换 成 int 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 float 型 数值 强制 转换 成 long 型 数值 并 将 结果 压 入 栈 顶 


( 续 ) 

















字 节 码 助 记 符 指令 含义 

Ox8d f2d 将 栈 顶 float 型 数值 强制 转换 成 double 型 数值 并 将 结果 压 入 栈 顶 

Ox8e d2i 将 栈 顶 double 型 数值 强制 转换 成 int 型 数值 并 将 结果 压 入 栈 顶 

Ox8f d21 将 栈 顶 double 型 数值 强制 转换 成 long 型 数值 并 将 结果 压 入 栈 顶 

Ox90 d2f 将 栈 顶 double 型 数值 强制 转换 成 float 型 数值 并 将 结果 压 入 栈 顶 

Ox91 i2b 将 栈 顶 int 型 数值 强制 转换 成 byte 型 数值 并 将 结果 压 入 栈 顶 

0x92 i2c 将 栈 顶 int 型 数值 强制 转换 成 char 型 数值 并 将 结果 压 入 栈 顶 

0x93 i2s 将 栈 顶 int 型 数值 强制 转换 成 short 型 数值 并 将 结果 压 入 栈 顶 

Ox94 lcmp 比较 栈 顶 两 long 型 数值 的 大 小 ， 并 将 结果 (1、0 或 一 1) 压 入 栈 顶 

Ox95 fcmpl 比较 栈 顶 两 foat 型 数值 的 大 小 ， 并 将 结果 (1、0 或 一 1) 压 人 栈 顶 ; 当 
其 中 一 个 数值 为 “NaN” 上 时， 将 一 1 压 入 栈 顶 

0x96 fempg 比较 栈 顶 两 float 型 数值 的 大 小 ， 并 将 结果 (1、0 或 -1) 压 入 栈 顶 ; 当 
其 中 一 个 数值 为 “NaN” 时 ， 将 1 压 入 栈 顶 

0x97 dcmpl 比较 栈 顶 两 double 型 数值 的 大 小 ， 并 将 结果 (1、0 或 -1) 压 入 栈 顶 ; 
当 其 中 一 个 数值 为 “NaN” 时 ,将 一 1 压 入 栈 顶 

Ox98 dcmpg 比较 栈 顶 两 double 型 数值 的 大 小 ， 并 将 结果 (1、0 或 一 1) 压 入 栈 顶 ; 
当 甚 中 一 个 数值 为 “NaN” 时 ， 将 1 压 入 栈 顶 

Ox99 ifeq 当 栈 顶 int 型 数值 等 于 0 时 跳 转 

Ox9a ifne 当 栈 顶 int 型 数值 不 等 于 0 时 跳 转 

Ox9b iflt 当 栈 顶 int 型 数值 小 于 0 时 跳 转 

0x9c ifge 当 栈 顶 int 型 数值 大 于 或 等 于 0 时 跳 转 

Ox9d ifgt 当 栈 顶 int 型 数值 大 于 0 时 跳 转 

Ox9e ifle 当 栈 顶 int 型 数值 小 于 或 等 于 0 时 跳 转 

Ox9f if_ icmpeq 比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 等 于 0 时 跳 转 

Oxa0 if icmpne 比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 不 等 于 0 时 跳 转 

Oxal 让 icmplt 比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 小 于 0 时 跳 转 

0xa2 if icmpge 比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 大 于 等 于 0 时 跳 转 

Oxa3 if icmpsgt 比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 大 于 0 时 跳 转 

Oxa4 if_ icmple 比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 小 于 或 等 于 0 时 跳 转 

Oxa5 if acmpeq 比较 栈 顶 两 引用 型 数值 ， 当 结果 相等 时 跳 转 

Oxa6 if acmpne 比较 栈 顶 两 引用 型 数值 ， 当 结果 不 相等 时 跳 转 

0xa7 goto 无 条 件 跳 转 

Oxa8 jsr 跳 转 至 指定 的 16 位 offset 位 置 ， 并 将 jsr 的 下 一 条 指令 地 址 压 入 栈 顶 

Oxa9 ret 返回 至 本 地 变量 指定 的 index 的 指令 位 置 (一 般 与 jsr 或 jsr_w 联合 使 用 ) 

Oxaa tableswitch 用 于 switch 条 件 跳 转 ，case 值 连续 (可 变 长 度 指令 ) 

Oxab lookupswitch 用 于 switch 条 件 跳 转 ，case 值 不 连续 (可 变 长 度 指 令 ) 

Oxac ireturn 从 当前 方法 返回 int 

Oxad lreturn 从 当前 方法 返回 long 








字 节 码 助 记 符 指令 含义 

0xae freturn 从 当前 方法 返回 float 

Oxaf dreturn 从 当前 方法 返回 double 

0xb0 areturn 从 当前 方法 返回 对 象 引 用 

0xbl return 从 当前 方法 返回 void 

0xb2 getstatic 获取 指定 类 的 静态 域 ， 并 将 其 值 压 入 栈 顶 

0xb3 putstatic 为 指定 的 类 的 静态 域 赋值 

Oxb4 getfield 获取 指定 类 的 实例 域 ， 并 将 其 值 压 入 栈 顶 

0xb5 putfield 为 指定 的 类 的 实例 域 赋值 

0xb6 invokevirtual 调用 实例 方法 

0xb7 invokespecial 调用 超 类 构造 方法 ， 实 例 初始 化 方法 ， 私 有 方法 

0xb8 invokestatic 调用 静态 方法 

0xb9 invokeinterface 调用 接口 方法 

0xba 无 此 指令 

0xbb new 创建 一 个 对 象 ， 并 将 其 引用 值 压 入 栈 顶 

0xbc newarray 创建 一 个 指定 的 原始 类 型 (如 int、float、char 等 ) 的 数组 ， 并 将 其 引 
用 值 压 入 栈 顶 

Oxbd anewarray 创建 一 个 引用 型 (如 类 、 接 口 、 数 组 ) 的 数组 ， 并 将 其 引用 值 压 入 栈 顶 

0xbe arraylength 获得 数组 的 长 度 值 并 压 入 栈 顶 

Oxbf athrow 将 栈 顶 的 异常 抛 出 

0xc0 checkcast 检验 类 型 转换 ， 检 验 未 通过 将 抛 出 ClassCastException 

0xcl instanceof 检验 对 象 是 否 是 指定 的 类 的 实例 ， 如 果 是 将 1 压 入 栈 顶 ， 否 则 将 0 压 入 
栈 顶 

0xc2 monitorenter 获得 对 象 的 锁 ， 用 于 同步 方法 或 同步 块 

0xc3 monitorexit 释放 对 象 的 锁 ， 用 于 同步 方法 或 同步 块 

0xc4 wide 扩展 本 地 变量 的 宽度 

0xc5 multianewarray 创建 指定 类 型 和 指定 维度 的 多 维 数 组 (执行 该 指令 时 ， 操 作 栈 中 必须 包 
含 各 维度 的 长 度 值 )， 并 将 其 引用 值 压 入 栈 顶 

0xc6 ifnull 为 null 时 跳 转 

0xc7 ifnonnull 不 为 null 时 跳 转 

Oxc8 goto Ww 无 条 件 跳 转 〈 宽 索引 ) 

0xc9 jsr_w 跳 转 至 指定 的 32 位 offset 位 置 ， 并 将 jsr_w 的 下 一 条 指令 地 址 压 入 栈 顶 


附录 C ” HotSpot 虚拟 机 主要 参数 表 


本 参数 表 以 JDK 1.6 为 基础 编写 ，JDK 1.6 的 HotSpot 虚 拟 机 有 很 多 非 稳定 参数 (Unstable Options， 即 以 -XX: 开头 的 参数 ，JDK 1.6 的 虚拟 机 中 大 概 有 660 多 个 ) ， 使 用 -XX: +PrintFlagsFinal 参 数 可 
以 输出 所 有 参数 的 名 称 及 默认 值 ， 下 面 的 各 个 表格 只 包含 了 其 中 最 常用 的 (或 在 本 书 中 介绍 到 的 ) 部 分 。 参 数 使 用 的 方式 有 如 下 三 种 : 
































“ -XX: +<option> 开启 option 参 数 。 
“ -XX: -<option> 关 闭 option 参 数 。 


“ -XX: <option>=<value> 将 option 参 数 的 值 设置 为 value。 


C.1 内存 管 理 参数 


参 数 默认 值 使 用 介绍 


DisableExplicitGC 默认 关闭 忽略 来 自 System.gc0 方法 触发 的 垃圾 收集 








ExpledG elnvekes 默认 关闭 当 收 到 System.gc() 方法 提交 的 垃圾 收集 申请 时 ， 使 用 
Concurrent A CMS 收集 器 进行 收集 
UseSerialGC Client 模式 的 虚拟 机 默 | ”虚拟 机 运行 在 Client 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 





认 开 启 ， 其 他 模式 关闭 使 用 Serial + Serial Old 的 收集 器 组 合 进行 内 存 回收 


New ;| 站 打开 此 开关 后 ， 使 用 ParNew + Serial Old 的 收集 器 组 合 
UseParNewGC 默认 关闭 进行 内 存 回收 


打开 此 开关 后 ， 使 用 ParNew + CMS + Serial Old 的 收集 
UseConcMarkSweepGC 默认 关闭 器 组 合 进 行内 存 回 收 。 如 果 CMS 收集 器 出 现 Concurrent 
Mode Failure， 则 Serial Old 收集 器 将 作为 后 备 收集 器 





mae 虚拟 机 运行 在 Server 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 
UseParallelGC i ee Ee Parallel Scavenge + Serial Old 的 收集 器 组 合 进 行内 存 


| S 打开 此 开关 后 ， 使 用 Parallel Scavenge + Parallel Old 的 
UseParallelOldGC 默认 关闭 收集 器 组 合 进行 内 存 回 收 


SurvivorRatio 默认 为 8 新 生 代 中 Eden 区 域 与 Survivor 区 域 的 容量 比值 








参 数 默认 值 使 用 介绍 
EE 直接 晋升 到 老年 代 的 对 象 大 小 ， 设 置 这 个 参数 后 ， 大 于 
PretenureSizeThreshold 无 默认 值 这 个 参数 的 对 象 将 直接 在 老年 代 分 配 


晋升 到 老年 代 的 对 象 年 龄 。 每 个 对 象 在 坚持 过 一 次 
MaxTenuringThreshold 默认 值 为 15 Minor GC 之 后 ， 年 龄 就 加 1， 当 超过 这 个 参数 值 时 就 进入 
老年 代 


UseAdaptiveSizePolicy 动态 调整 Java 堆 中 各 个 区 域 的 大 小 及 进入 老年 代 的 年 龄 


是 否 允 许 分 配 担 保 失败 ， 即 老年 代 的 剩余 空间 不 足以 应 
付 新 生 代 的 整个 Eden 和 Survivor 区 的 所 有 对 和 象 都 存活 的 
极端 情况 





JDK 1.5 及 以 前 是 默认 


HandlePromotionFailure 关闭 ，JDK 1.6 默认 开启 





少 于 或 等 于 8 个 CPU 


时 默认 值 为 CPU 数量 值 ， 


ParallelGCThreads 设置 并 行 GC 时 进行 内 存 回 收 的 线程 数 


多 于 8 个 时 比 CPU 数 量 
值 小 





MaxGCPauseMillis 无 默认 值 pe 顿时 间 。 仅 在 使 用 Parallel Scavenge 
DE a: 
CMSInitiatingOccupancy 默认 值 为 68 设置 CMS 收集 器 在 老年 代 空 间 被 使 用 多 少 后 触发 垃圾 
Fraction 收集 ， 仅 在 使 用 CMS 收集 器 时 生效 


到 GC 时 间 占 总 时 间 的 比率 ， 默 认 值 为 99， 即 允许 1% 的 
GCTimeRatio 默认 值 为 99 GC 时 间 。 仅 在 使 用 Parallel Scavenge 收集 器 时 生效 
UseCMSCompactAtFull 默认 开启 设置 CMS 收集 器 在 完成 垃圾 收集 后 是 否 要 进行 一 次 内 
Collection 存 雁 片 整理 。 仅 在 使 用 CMS 收集 器 时 生效 


Server 模式 默认 开启 ”| 优先 在 本 地 线程 缓冲 区 中 分 配对 象 ， 避 免 分 配 内存 时 的 
锁定 过 程 
当 Xmx 值 比 Xms 值 大 时 ， 堆 可 以 动态 收缩 和 扩展 ， 这 
Wai 和 个 参数 控制 当 堆 空 闪 大 于 指定 比率 时 自动 收缩 
. . 当 Xmx 值 比 Xms 值 大 时 ， 堆 可 以 动态 收缩 和 扩展 ， 这 
Se Wb 个 参数 控制 当 堆 空闲 小 于 指定 比率 时 自动 扩展 四 


永和 久 代 的 最 大 值 


CMSFullGCsBefore 无 默认 值 设置 CMS 收集 器 在 进行 若干 次 垃圾 收集 后 再 启动 一 次 
Compaction 内 存 碎片 整理 。 仅 在 使 用 CMS 收集 器 时 生效 

a 、 禁止 GC 过 程 无 限制 地 执行 ， 如 果 过 于 频繁 ， 就 直接 发 
UseGCOverheadLimit 默认 开启 生 OutOfMemory 异常 


启 
ScavengeBeforeFullGC 默认 开启 在 Full GC 发 生 之 前 触发 一 次 Minor GC 
i 号 


大 部 分 情况 下 默认 值 是 


MaxPermSize 64MB 





C.2 ”即时 编译 参数 


参 数 默认 值 使 用 介绍 





Client 模式 下 默认 值 是 1500， 


Server 模式 下 是 10000 触发 方法 即时 编译 的 浆 值 


CompileThreshold 





OSR 比率 ， 它 是 OSR 即时 编译 国 值 计算 公式 的 
一 个 参数 ， 用 于 代替 BackEdgeThreshold 参数 控制 
回 边 计 数 器 的 实际 谥 出 阔 值 


Client 模式 下 默认 值 是 933， 
Server 模式 下 是 140 


OnStackReplacePercentage 





ReservedCodeCacheSize 大 部 分 情况 下 默认 值 是 32MB 即时 编译 器 编译 的 代码 缓存 的 最 大 值 





C.3 ”类 型 加 载 参 数 





























参 数 默认 值 使 用 介绍 
UseSplitVerifier 默认 开启 人 信息 的 类 型 检查 代替 数据 流 分 析 ， 以 加 
本 - 日. 了 ~ 人 交 验 >; 并 4 行 术 : 
FailOverToOldVerifier 默认 开启 验 当 人 eT 
RelaxAccessControlCheck 默认 关闭 在 校 验 阶段 放松 对 类 型 访问 性 的 限制 
C.4 ”多 线程 相关 参数 
参 数 默认 值 使 用 介绍 
UseSpinning 启 ， 开启 自 旋 锁 以 避免 线程 频繁 的 挂 起 和 唤醒 
PreBlockSpin 默认 值 为 10 使 用 自 旋 锁 时 默认 的 自 旋 次 数 
UseThreadPriorities 默认 开启 使 用 本 地 线程 优先 级 
UseBiasedLocking 默认 开启 是 否 使 用 偏向 锁 ， 如 果 开 启 则 使 用 
站 默认 开启 _ 当 频繁 反射 执行 某 个 方法 时 ， 生 成 字 节 码 来 加 快 反射 的 执 
行 速度 
C.5 ”性 能 参数 
参 数 默认 值 使 用 介绍 
ee JDK 1.6 默认 开启 ， 使 用 激进 的 优化 特性 ， 这 些 特性 一 般 是 有 具备 正面 和 负面 双重 影 
EE JDK 1.5 默认 关闭 “| 响 的 ， 需 要 根据 具体 应 用 特点 分 析 才能 判定 是 否 对 性 能 有 好 处 
UseLargePages 默认 开启 如 果 可 能 ， 使 用 大 内 存 分 页 ， 这 项 特性 需要 操作 系统 的 支持 
LargePageSizeInBytes 默认 为 4MB 使 用 指定 大 小 的 内 存 分 页 ， 这 项 特性 需要 操作 系统 的 支持 
StringCache 默认 开启 是 否 使 用 字符 串 缓 存 ， 开 启 则 使 用 


C.6 “调试 参数 








参 数 默认 值 使 用 介绍 
rn i ; 在 发 生 内 存 溢出 异常 时 是 否 生成 堆 转 储 快照 ， 关 闭 
OnOutOfMemoryError 无 默认 值 当 虚 拟 机 抛 出 内 存 溢出 异常 时 ， 执 行 指定 的 命令 
OnError 无 默认 值 当 虚 拟 机 抛 出 ERROR 异常 时 ， 执 行 指定 的 命令 


使 用 [ctrl]-[break] 快捷 键 输出 类 统计 状态 ， 相 当 于 
jmap -histo 的 功能 


PrintConcurrentLocks 默认 关闭 打印 J.U.C 中 锁 的 状态 
PrintCommandLineFlags 默认 关闭 打印 局 动 虚拟 机 时 输入 的 非 稳定 参数 
PrintCompilation 默认 关闭 打印 方法 即时 编译 信息 

PrintGC 默认 关闭 打印 GC 信息 

PrintGCDetails 默认 关闭 打印 GC 的 详细 信息 
PrintGCTimeStamps 默认 关闭 打印 GC 停顿 耗 时 
PrintTenuringDistribution 默认 关闭 打印 GC 后 新 生 代 各 个 年 龄 对 象 的 大 小 
TraceClassLoading 默认 关闭 打印 类 加 载 信息 

TraceClassUnloading 默认 关闭 打印 类 外 载 信息 

PrintInlining' 默认 关闭 打印 方法 的 内 联 信息 


将 CFG 图 信息 输出 到 文件 ， 只 有 DEBUG 版 虚拟 机 
才 文 持 此 参数 


将 Ideal 图 信息 输出 到 文件 ， 只 有 DEBUG 版 虚拟 机 
才 支 持 此 参数 


让 虚拟 机 进入 诊断 模式 ， 一 些 参数 (如 PrintAssembly) 
需要 在 诊断 模式 中 才能 使 用 


PrintAssembly 默认 关闭 打印 即时 编译 后 的 二 进 制 信息 


PrintClassHistogram 默认 关闭 





PrintCFGToFile 默认 关闭 


PrintIdealGraphFile 默认 关闭 


UnlockDiagnosticVMOptions 默认 关闭 


附录 D ”对 象 查 询 语言 (OQL) 简介 趾 


D.1 SELECT 子 句 


SELECT 子 句 用 于 确定 查询 语句 需要 从 堆 转 储 快照 中 选择 什么 内 容 。 如 果 需 要 显示 堆 转 储 快照 中 的 对 象 ， 并 且 浏 览 这 些 对 象 的 引用 关系 ， 可 以 使 用 “*” ， 这 与 传统 SQL 语句 中 的 习惯 是 一 致 的 ， 例 如 : 





SELECT * FROM java.lang.String 





D.1.1 选择 特定 的 显示 列 


查询 也 可 以 选择 特定 的 需要 显示 的 字段 ， 例 如 : 








SELECT toString(s), s.count, s.value FROM java.lang.String s 


























查询 可 以 用 “@ ”符号 来 使 用 java 对 象 的 内 存 属性 访问 器 。MAT 提 供 了 一 系列 的 内 置 函数 来 获取 与 分 析 相 关 的 信息 ， 例 如 : 




















SELECT toString(s)，s.eusedHeapSize，s.QretainedHeapSize FROM java.lang.String s 











关于 对 象 属性 访问 器 的 具体 内 容 ， 可 以 参见 下 文 的 “属性 访问 器 ”。 


D.1.2 ”使 用 列 别名 








可 以 使 用 As 关键 字 来 对 选择 的 列 进行 命名 ， 例 如 : 














SELECT toString(s) AS Value 


s.eusedHeapSize AS "Shallow Size", 


s.Q@retainedHeapSize AS "Retained 
FROM java.lang.String s 


Size" 











可 以 使 用 “As RETAINED SET” 关 键 字 来 获得 与 选择 对 象 相关 联 的 对 象 集合 ， 例 如 : 











SELECT AS RETAINED SET * FROM java.lang.String 





D.1.3 ”拼合 成 为 一 个 对 象 列表 选择 项 目 








可 以 使 用 “OBJECTS” 关 键 字 把 SELECT 子 句 中 查找 出 来 的 数据 项 目 转变 为 对 象 ， 例 如 : 











SELECT OBJECTS dominators(s) FROM java.lang.String s 





上 面 的 例子 中 ， 函 数 “dominators()” 将 会 返回 


减 为 一 维 的 对 象 列表 。 


D.1.4 ”排除 重复 对 象 








使 用 “DISTINCT” 关 键 字 可 以 排除 结果 集中 的 是 














和 E 复 对 象 ， 例 如 : 








一 个 对 象 数组 ， 所 以 如 果 没 有 “OBJECTS” 关 键 字 ， 上 面 的 查询 将 返回 一 组 二 维 的 对 象 数组 列表 。 通 过 使 用 关键 字 “OBJECTS” 人 迫使 OQL 把 查询 结果 缩 




















SELECT DISTINCT classof(s) FROM java.lang.String s 

















上 面 的 例子 中 ， 函 数 “classof()” 的 作用 是 返 








回 对 象 所 





中 的 字符 串 数量 一 样 多 的 行 记录 ， 并 且 每 行 记录 的 





D.2 FROM 子 句 


D.2.1 FROM 子 句 指定 需要 查询 的 类 


OQL 查 询 需 要 在 FROM 子 句 定义 的 查询 范围 上 进行 操作 。FROM 子 句 可 以 接受 的 查询 范围 





1) 通过 类 名 进行 查询 ， 例 如 : 





属 的 Java 类 ， 当 然 ， 所 有 字符 串 对 象 的 所 


内 容 都 是 java.lang.String 类 型 。 








属 类 都 是 java.lang.String， 所 以 如 果 上 面 的 查询 中 没有 加 入 DISTINCT 关 键 字 ， 查 询 结果 就 会 返回 与 快照 


描述 包括 如 下 几 种 方式 : 





SELECT * FROM java.lang.String 





2) 通过 正则 表达 式 匹 配 一 组 类 名 进行 查询 ， 例 如 : 








SELECT * FROM "java\.lang\http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/..*" 





3) 通过 类 对 象 在 堆 转 储 快照 中 的 地 址 进行 查询 ， 例 如 : 





SELECT * FROM Oxel4al00 





4) 通过 对 象 在 堆 转 储 快照 中 的 ID 进行 查询 ， 例 如 : 





SELECT * FROM 3022 





5) 在 子 查询 中 的 结果 集中 进行 查询 ， 例 如 : 





SELECT * FROM (SELECT * FROM java.lang.Class C WHERE c implements org.eclipse.mat.snapshot .model.IClass) 





上 面 的 查询 返回 堆 转 储 快照 中 所 有 实现 了 “org.eclipse.mat.snapshot.model.IClass” 接 | 



































的 类 。 下 面 的 这 句 查 询 使 用 属性 访问 器 达到 了 同样 的 效果 ， 它 直接 调用 了 ISnapshot 对 象 的 方法 : 






































SELECT * FROM $snapshot.getClasses() 





D.2.2 包含 子 类 








使 用 “INSTANCEOF” 关 键 字 把 指定 类 的 子 类 列 入 查询 结果 集 之 中 ， 例 如 : 











SELECT * FROM INSTANCEOF java.lang.ref.Reference 








这 个 查询 的 结果 集中 将 会 包含 WeakReference、SoftReference 和 PhantomReference 类 型 的 对 象 ， 因 为 它们 都 继承 自 java.lang.ref.Reference。 下 面 这 句 查询 也 有 相同 的 结果 : 




















SELECT * FROM $snapshot.getClassesByName ("java.lang.ref.Reference", true) 





D.2.3 ”禁止 查询 类 实例 








在 FROM 子 句 中 使 用 “OBJECTS” 关 键 字 可 以 禁止 OQL 把 查询 的 范围 解释 为 对 象 实例 ， 例 如 : 

















SELECT * FROM OBJECTS java.lang.String 





这 个 查询 的 结果 不 是 返回 快照 中 所 有 的 字符 


D.3 ”WHERE 子 句 





D.3.1 >=、<=、>、<、[NOTJLIKE、[NOTJIN (关系 操作 ) 











WHERE 子 句 用 于 指定 搜索 的 条 件 ， 即 从 查询 结果 中 删除 不 需要 的 数据 ， 例 如 : 











， 而 是 只 有 一 个 对 象 ， 也 就 是 java.lang.String 类 对 应 的 Class 对 象 。 





SELECT * FROM java.lang.String s WHERE s.count >= 100 
SELECT * FROM java.lang.String s WHERE toString(s) LIKE "“.*day" 
SELECT * FROM java.lang.String s WHERE s.value NOT IN dominators(s) 





D.3.2 =、! = (等 于 操作 ) 





SELECT * FROM java.lang.String s WHERE toString(s) = "monday" 





D.3.3 AND (条 件 与 操作 ) 





SELECT * FROM java.lang.String s WHERE s.count > 100 AND s.@retainedHeapSize > s.@usedHeapSize 





D.3.4 ”OR (条 件 或 操作 ) 








“条 件 或 操作 ”可 以 应 用 于 表达 式 、 常 量 文本 和 子 查询 之 中 ， 例 如 : 











SELECT * FROM java.lang.String s WHERE s.count > 1000 OR s.value.@length > 1000 





D.3.5 文字 表达 式 


文字 表达 式 包 括 了 布尔 值 、 字 符号 





PB、 整 型 、 长 整 型 和 null， 例 如 : 





SELECT * FROM java.lang.String s 
WHERE ( s.count > 1000 ) 
WHERE toString(s) = "monday" 
WHERE dominators(s) .size() = 0 
WHERE s.@retainedHeapSize > 1024L 
WHERE s.@GCRootInfo != null 





D4 属性 访问 器 


D4.1 ”访问 堆 转 储 快照 中 对 象 的 字段 








对 象 的 内 存 属性 可 以 通过 传统 的 “点 表示 法 ”进行 访问 ， 格 式 为 : 








[<alias>.] <field>.<field>.<field>http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 








D.4.2 ”访问 Java Bean 属 性 


格式 为 : 





[<alias>.] @<attribute> http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/13441/0EBPS/Text/... 
































使 用 @ 符 号 ，OQL 可 以 访问 底层 Java 对 象 的 内 存 属性 。 下 表 列 出 了 一 些 常用 的 Java 属 性 。 
目标 接口 属性 含义 

objectId 快照 中 对 象 的 ID 
objectAddress 快照 中 对 象 的 地 址 
Class 对 象 所 属 的 类 

任意 堆 中 的 对 象 Iobject 
usedHeapSize 对 象 的 ShallowSize 
retainedHeapSize 对 象 的 RetainedSize 
displayName 对 象 的 显示 名 称 

类 对 象 Iclass classLoaderId 类 加 载 器 的 ID 

任意 数组 Iarray length 数组 的 长 度 








D.4.3 ”调用 OQL Java 方 法 


格式 为 : 





[<alias>.]8< 方 法 > ( [< 表达 式 >，< 表 达 式 >] ) http://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/13441/OEBPSVText/... 





加 “0” 将 会 令 MAT 解 释 为 一 个 OQL Java 方 法 调用 。 这 个 方法 的 调用 是 通过 反射 执行 的 。 常 见 的 OQL Java 方 法 如 下 : 








目标 接口 方法 含义 
getClasses() 获取 所 有 类 的 集合 
$snapshot Isnapshot getClassesByNamel(String 获取 指定 类 的 集合 


name.boolean includeSubClasses) 





Class object Iclass 


D.4.4 ”OQL 的 内 建 函 数 
格式 为 : 


<function> (<parameter>) 


hasSuperClass() 


如 果 对 象 有 父 类 ， 则 返回 true 








1SAlTayTypeO) 





如 果 Class 是 数组 类 型 ， 则 返回 true 





函数 名 称 


作 用 





toHex( number ) 


以 十 六 进 制 的 形式 打印 数字 





toString( object ) 


返回 对 象 的 值 ， 即 使 用 一 个 字符 串 表 示 对 象 的 内 容 





dominators( object ) 


返回 直接 持 有 指定 对 象 的 对 象 列表 





outbounds( object ) 


获取 对 象 的 外 部 引用 





inbounds( object ) 


获取 对 象 的 内 部 引用 





classof( object ) 


获取 对 象 所 属 的 类 型 对 象 





dominatorof( object ) 


D.5 ”OQLi 语 言 的 BNF 范 式 





返回 直接 持 有 当前 对 象 的 对 象 列表 ， 如 果 没 有 则 返回 一 1 


目 标 


SelectStatement 


SelectList 


村 ”法 
"SELECT" SelectList FromClause ( WhereClause )? ( UnionClause )? 


(( "DISTINCT" | "AS RETAINED SET'" )? ("*" | "OBJECTS" SelectItem | 
SelectItem ( "," SelectItem )* )) 





SelectItem 


( PathExpression | EnvVarPathExpression ) ( "AS" ( <STRING _ 
LITERAL> | <IDENTIFIER> ) )?</IDENTIFIER></STRING LITERAL> 





PathExpression 


( ObjectFacet | BuildInFunction ) ( "." ObjectFacet )* 





EnvVarPathExpression 


("$" <IDENTIFIER> ) ("." ObjectFacet )* 





ObjectFacet 


(("@")? <IDENTIFIER> ( ParameterList )? ) 





ParameterList 


"(" ((PrimaryExpression ("," PrimaryExpression )* ) )? ")" 





FromClause 


"FROM" ( "OBJECTS" )? ( "INSTANCEOF" )? ( FromlItem | "(" 
SelectStatement ")" ) ( <IDENTIFIER> )? 





Fromltem 


ClassName 
ObjectAddress 


ObjectId 





( ClassName | <STRING LITERAL> | ObjectAddress ( "," ObjectAddress 
)* | ObjectId ( "." ObjectId )* | EnvVarPathExpression ) 


( <IDENTIFIER> ("." <IDENTIFIER> )* ( "[]" )* ) 
<HEX LITERAL> 


<INTEGER LITERAL> 











目 标 接 口 方 法 
WhereClause "WHERE" ConditionalOrExpression 
ConditionalOrExpression 区 ConditionalAndExpression ( "or" ConditionalAndExpression )* 
ConditionalAndExpression | EqualityExpression ( "and" EqualityExpression )* 
Boualitylxpiesdion | a (("=" RelationalExpression | "!=" 
和 ( PrimaryExpression ( ( "<" PrimaryExpression | ">" PrimaryExpression | 
RelationalExpression "<=" PrimaryExpression | ">=" PrimaryExpression | ( LikeClause | InClause 
)| "implements" ClassName ) )? ) 
LikeClause | ("NOT" )? "LIKE" <STRING LITERAL> 
InClause | ("NOT" )? "IN" PrimaryExpression 
PrimaryExpression | Literal 
| "(" ( ConditionalOrExpression | SubQuery ) ") 
| PathExpression 
| EnvVarPathExpression 
SubQuery SelectStatement 
rt ( ("toHex" | "toString" | "dominators" | "outbounds" | "inbounds" | 
"classof" | "dominatorof" ) "(" ConditionalOrExpression ")" ) 
( <INTEGER LITERAL> | <LONG LITERAL> | <FLOATING POINT_ 
Literal LITERAL> | <CHARACTER LITERAL> | <STRING LITERAL> | 
BooleanLiteral | NullLiteral ) 
BooleanLiteral | "true" 
"false" 
NullLiteral <NULL> 
UnionClause | | ("UNION" "(" SelectStatement ")" )+ 


上 本 附录 翻译 自 Eclipse Memory Analyzer Tool (MAT，Eclipse 出 品 的 内 存 分 析 工 具 ) 的 OQL 帮助 文档 。 


附录 E JDK 历 史 版 本 轨迹 








大 部 分 的 JDK 历 史 版 本 (JDK 1.1.6 之 后 的 版 本 ) ， 以 及 JDK 附 带 的 各 种 工具 的 历史 版 本 ， 都 可 以 从 Oracle 公 司 的 网 站 [0 上 下 载 到 。 


主 版 本 


JDK 1.0 


JDK 1.1 


JDK 1.2 


JDK 1.3 








| 
| 
ao 
| 
| 
EE 
mm 

JDK 1.3.0 Update 3 (HotSpot 1.3.0 03) 

JDK 1.3.0 Update 4 (HotSpot 1.3.0 04) 
em 


主 版 本 子 版 本 及 虚拟 机 版 本 工程 代号 发 布 日 期 


JDK 1.3.1 Update 1a (HotSpot 1.3.1 01a) 








JDK 1.3.1 Update 2 (HotSpot 1.3.1_02) 


JDK 1.3.1 Update 3 (HotSpot 1.3.1_03) 


JDK 1.3.1 Update 4 (HotSpot 1.3.1 04) 





JDK 1.3.1 Update 5 (HotSpot 1.3.1_05) 





JDK 1.3 JDK 1.3.1 Update 6 (HotSpot 1.3.1_06) 


JDK 1.3.1 Update 7 (HotSpot 1.3.1_07) 


JDK 1.3.1 Update 8 (HotSpot 1.3.1_08) 











JDK 1.3.1 Update 9 (HotSpot 1.3.1_09) 


JDK 1.3.1 Update 10 (HotSpot 1.3.1_10) 


JDK 1.3.1 Update 11 (HotSpot 1.3.1_11) 


JDK 1.3.1 Update 12 (HotSpot 1.3.1_12) 


JDK 1.4.0 (HotSpot 1.4.0) Merlin 2002-02-13 
JDK 1.4.0 Update 1 (HotSpot 1.4.0_01) 


JDK 1.4.0 Update 2 (HotSpot 1.4.0_02) 








JDK 1.4.0 Update 3 (HotSpot 1.4.0_03) 


JDK 1.4.0 Update 4 (HotSpot 1.4.0_04) 


JDK 1.4.1 (HotSpot 1.4.1) Grasshopper 2002-09-16 


JDK 1.4.1 Update 1 (HotSpot 1.4.1 01) 





JDK 1.4.1 Update 2 (HotSpot 1.4.1 02) 


JDK 1.4 JDK 1.4.1 Update 3 (HotSpot 1.4.1_03) 


JDK 1.4.1 Update 4 (HotSpot 1.4.1 04) 








JDK 1.4.1 Update 5 (HotSpot 1.4.1 05 ) 


JDK 1.4.1 Update 6 (HotSpot 1.4.1 06) 
JDK 1.4.1 Update 7 (HotSpot 1.4.1 07) 


JDK 1.4.2 (HotSpot 1.4.2-b28 ) 





Mantis 2003-06-26 





JDK 1.4.2 Update 1 (HotSpot 1.4.2 _ 01) 








JDK 1.4.2 Update 2 (HotSpot 1.4.2 02) 


JDK 1.4.2 Update 3 (HotSpot 1.4.2_03) 


( 续 ) 


主 版 本 子 版 本 及 虚拟 机 版 本 工程 代号 发 布 日 期 


JDK 1.4.2 Update 4 (HotSpot 1.4.2 04) 





JDK 1.4.2 Update 5 (HotSpot 1.4.2_05) 








JDK 1.4.2 Update 6 (HotSpot 1.4.2 06) 


JDK 1.4.2 Update 7 (HotSpot 1.4.2_07) 
JDK 1.4.2 Update 8 (HotSpot 1.4.2 08-b03) 
JDK 1.4.2 Update 9 (HotSpot 1.4.2_09-b05) 


JDK 1.4.2 Update 10 (HotSpot 1.4.2_10-b03) 








JDK 1.4.2 Update 11 (HotSpot 1.4.2_ 11-b06) 


JDK 1.4 
JDK 1.4.2 Update 12 (HotSpot 1.4.2_12-b03) 
JDK 1.4.2 Update 13 (HotSpot 1.4.2_13-b03) 


JDK 1.4.2 Update 14 (HotSpot 1.4.2_14-b05) 








JDK 1.4.2 Update 15 (HotSpot 1.4.2_15-b02) 


JDK 1.4.2 Update 16 (HotSpot 1.4.2_16-b01) 


JDK 1.4.2 Update 17 (HotSpot 1.4.2_17-b06) 





JDK 1.4.2 Update 18 (HotSpot 1.4.2_18-b06) 


JDK 1.4.2 Update 19 (HotSpot 1.4.2_19-b04) 


JDK 1.5.0 (HotSpot 1.5.0-b64) Tiger 2004-09-29 








JDK 1.5.0 Update 1 (HotSpot 1.5.0_01) 


JDK 1.5.0 Update 2 (HotSpot 1.5.0_02-b09) 


JDK 1.5.0 Update 3 (HotSpot 1.5.0 03-b07) 








JDK 1.5.0 Update 4 (HotSpot 1.5.0_04-b05) 


JDK 1.5.0 Update 5 (HotSpot 1.5.0_05-b05) 


JDK 1.5.0 Update 6 (HotSpot 1.5.0_06-b05) 








JDK. 1.5 
JDK 1.5.0 Update 7 (HotSpot 1.5.0_07-b03) 


JDK 1.5.0 Update 8 (HotSpot 1.5.0 08-b03) 


JDK 1.5.0 Update 9 (HotSpot 1.5.0_09-b03) 








JDK 1.5.0 Update 10 (HotSpot 1.5.0 10-b02) 


JDK 1.5.0 Update 11 (HotSpot 1.5.0_11-b03) 





JDK 1.5.0 Update 12 (HotSpot 1.5.0_12-b04) 





JDK 1.5.0 Update 13 (HotSpot 1.5.0_13-b01) 








主 版 本 子 版 本 及 虚拟 机 版 本 
JDK 1.5.0 Update 14 (HotSpot 1.5.0 _ 14-b03 ) 
JDK 1.5.0 Update 15 (HotSpot 1.5.0_15-b04) 


JDK 1.5.0 Update 16 (HotSpot 1.5.0_16-b02) 





JDK 1.5.0 Update 17 (HotSpot 1.5.0_17-b04) 


JDK 1.5.0 Update 18 (HotSpot 1.5.0_18-b02) 


JDK.1.5 





JDK 1.5.0 Update 19 (HotSpot 1.5.0_19-b02) 


DK TS 


Dragonfly 


取消 发 布 





JDK 1.6.0 (HotSpot 1.6.0-b105) 
JDK 1.6.0 Update 1 (HotSpot 1.6.0 01-b06) 


Mustang 


2006-12-11 





JDK 1.6.0 Update 2 


JDK 1.6.0 Update 3 


JDK 1.6.0 Update 10 (HotSpot 11.0-b15) 








JDK 1.6.0 Update 11 


JDK 1.6 


JDK 1.6.0 Update 18 (HotSpot 16.0-b13) 





2009-05-28 





JDK 1.6.0 Update 19 (HotSpot 16.2-b04) 





主 版 本 子 版 本 及 虚拟 机 版 本 


JDK 1.6.0 Update 22 (HotSpot17.1-b03 ) 
JDK 1.6 
JDK 1.6.0 Update 23 (HotSpot 19.0-b09 ) 


工程 代号 


2010-07-10 


Wm 
注 
SA 


人 


发 布 日 期 
2010-10-22 


2010-12-08 





JDEK 1:7 JDRKS1:70 





[由 下 载 页 面 地 址 : http://www.oracle.com/technetwork/java/archive-139210.html。 





Dolphin 


2011-07-28 


